배꼽파지 않도록 잘 개발해요

방송대 클라우드컴퓨팅 - 10강. 클라우드 아키텍처 1 본문

방송대 컴퓨터과학과/클라우드컴퓨팅

방송대 클라우드컴퓨팅 - 10강. 클라우드 아키텍처 1

꼽파 2025. 11. 5. 09:44

 

1. 클라우드 아키텍처의 이해

2. 리소스 풀링과 로드 밸런싱

[실습] 


1. 클라우드 아키텍처의 이해

(1) 개념

클라우드 아키텍처란 클라우드 기반 정보 서비스를 안정적이고 효율적으로 설계하기 위한 구조를 말한다.

서비스의 표준화, 자동화, 최적화를 통해 안정성과 가용성(HA)를 높이는 것이 목적이다.

→ 즉, 동적으로 변화하는 요청량에 따라 리소스를 조정하여 비용 대비 최적의 서비스 품질을 확보하는 체계이다.

 

(2) 주요 개념

① 서비스 오케스트레이션 (Service Orchestration)

  • 정의: 복잡한 클라우드 리소스와 워크플로를 자동화된 설정·관리·조정으로 제어하는 기술
  • 핵심: 자동화된 리소스 프로비저닝(Provisioning) — 필요한 시점에 즉시 리소스를 배치하고 관리

② 클라우드 서비스 관리 구성요소

구분 설명
경영 지원 과금, 감사 정책 관리 등 클라우드 리소스 관리의 행정적 지원
프로비저닝/구성 리소스 추가·변경·삭제·모니터링, SLA(Service Level Agreement) 관리
이식성(Portability) 한 시스템에서 다른 시스템으로 데이터를 손쉽게 이전 가능
상호운용성(Interoperability) 서로 다른 시스템 간 데이터 교환 및 연동이 가능한 특성

 

 

(3) 클라우드 아키텍처링의 목적과 전략

  • 서비스 대상 및 리스크를 분석해 컴퓨팅 리소스를 적절히 배치·설계하는 과정
  • 이를 통해 서비스의 효율성과 가용성을 극대화함.
  • 아키텍처 기법: 리소스 풀링, 로드밸런싱, 오토스케일링, 클라우드 버스팅
전략 설명
다중 애플리케이션 서버와 부하분산 여러 서버에 트래픽을 분산하여 장애 대응
데이터베이스/스토리지 이중화 데이터 안정성 확보
지리적 분산 배치 지역별 장애에도 지속적인 서비스 운영 가능

 

 

(4) 고가용성(HA: High Availability)

  • 정의: 시스템이 오랜 시간 동안 지속적으로 정상 운영되는 특성
  • 기준: “5 Nines” — 99.999% 가용성 → 연간 5분 15초 이하의 다운타임 허용
  • 확보 방안: 다중 애플리케이션 서버와 부하 분산, 데이터베이스 혹은 스토리지의 이중화, 여러 지리적 위치에 따른 서비스 배치
  • 핵심 기술: 리소스 풀링, 로드 밸런싱, 오토스케일링, 클라우드 버스팅 등

2. 리소스 풀링(Resource Pooling)

(1) 개념

리소스 풀링은 서비스에서 즉시 사용할 수 있는 서버, 스토리지 등의 IT 자원을 담아둔 공간(pool)을 구성하여,
요청이 발생하면 즉시 할당하고 사용 종료 시 반환하는 과정이다.

 

(2) 주요 특징

항목 설명
가용성 중심 구조 서비스 요청 시 지연 없이 즉시 리소스 사용 가능
지리적 계층 구조 도시·국가 단위의 데이터센터로 구성되어, 사용자와 물리적으로 가까운 위치에서 리소스 제공
리소스 추상화 실제 물리 위치는 알 수 없으며, 서비스/애플리케이션이 자유롭게 사용 및 해제
동적 사용량 관리 CSP(클라우드 서비스 제공자)가 사용량을 실시간으로 모니터링 및 과금

 

(3) 리소스 풀 구성 및 관리 요소

  • 그룹 풀: 리소스 유형별로 모아 놓은 풀 여러 개를 큰 풀로 묶는 것
    • 유연한 계층 구성: 풀 간 분리, 풀 내 공유 가능
    • 액세스 제어 및 위임: 보안적 접근 관리
    • 하드웨어 추상화: 물리 리소스로부터 독립된 가상화 구조
    • 모니터링 시스템: 감사 모니터, 사용량 모니터, 원격 운영 시스템 등이 리소스 상태를 지속 감시
  • 리소스 풀 모니터링
    • 클라우드에서 리소스를 빌려 쓰되 사용자는 사용한 만큼 비용을 지불
    • 리소스 풀에 있는 리소스의 가용성을 확인하는 역할

리소스 풀 그룹 풀

3. 로드 밸런싱(Load Balancing)

(1) 정의

로드 밸런싱은 사용자의 요청을 여러 대의 서버로 분산하여 부하를 최소화하고,
시스템 자원의 활용률과 응답 속도를 향상시키는 기술

 

(2) 필요성

  • 트래픽 급증이나 특정 서버 과부하 방지
  • 확장(Scale-out) 및 축소(Scale-in) 등 동적 스케일링 시 필수
  • 서버 중단 시에도 요청이 다른 서버로 자동 분산되어 장애 대응이 가능

 

(3) 스케일링 유형 비교

구분 수직 스케일링 (Vertical) 수평 스케일링 (Horizontal)
 
방법 CPU, RAM 등 하드웨어 성능 증설 동일한 서버를 여러 대 추가
확장성 한계 있음 지속적인 확장 가능
비용 고가 장비 필요, 비용 부담 큼 비교적 저렴, 유연성 높음
장애 대응 한 대 서버 장애 시 전체 영향 여러 서버 분산으로 영향 적음
적용 예시 단일 서버 성능 향상 로드밸런서와 함께 분산 처리

 

 

(4) 로드밸런서의 역할

  • 클라이언트와 서버 사이에 위치하여 요청 트래픽을 적절히 분산
  • 특정 서버에 과부하가 집중되지 않도록 조절하여 서비스 연속성 유지
  • L4/L7 로드밸런싱 계층에 따라 네트워크 수준 또는 애플리케이션 수준에서 트래픽 제어

 

(5) 오토스케일링(Autoscaling) 및 리스너

  • 오토스케일링: 로드밸런싱과 연동되어 CPU 사용률 등 특정 임계값을 초과하면 자동으로 서버를 추가하거나 축소
  • 리스너(Listener): 사전에 정의된 조건(CPU 90% 초과 등)이 발생하면 자동으로 이벤트를 감지해 확장 트리거 수행

4. 요약 정리

핵심 개념 설명
서비스 오케스트레이션 리소스 프로비저닝 및 워크플로 자동화 기술
클라우드 아키텍처링 안정적 서비스 제공을 위한 리소스 배치 및 리스크 설계
리소스 풀링 즉시 사용 가능한 IT 자원 풀을 구성해 효율적 사용
로드 밸런싱 사용자 요청을 다수의 서버로 분산하여 부하를 조절
스케일링 수직/수평 확장으로 성능 및 가용성 향상
오토스케일링 + 리스너 임계값 감지 후 자동 자원 확장 및 복구 기능
고가용성(HA) 99.999% 수준의 지속적 서비스 운영 목표
728x90