AutoScale 서비스
AutoScale은 인스턴스의 부하 또는 장애 등과 같은 상황을 대비하여 지속적으로 모니터링하여 필요한 경우 인스턴스를 확장하거나 축소할 수 있도록 하는 클라우드 핵심 기술입니다.
AutoScale을 통해 부하와 장애에 실시간으로 대응하여 안정적이고 탄력적인 사용자 서비스를 제공할 수 있습니다.
스케일링이란 ?
스케일링이란 인스턴스 혹은 컴퓨팅 파워를 확장하는 것을 스케일링이라고 합니다.
Scale Up
현재 가지고 있는 하드웨어 장비의 성능을 높이는 것, 인스턴스 서버의 스펙을 높이는 것
Scale Out
규모를 늘리는 것, 장비를 추가해서 확장하는 방식
Scale In
더 이상 필요 없는 인스턴스 수를 줄이는 것
Auto Scaling Group
- 인스턴스를 추가로 생성 또는 삭제하는 조건과 조건이 만족하는 경우 수행할 행동을 정의하는 것입니다.
- 최소, 최대, 구동 인스턴스는 스케일링 그룹에서 반드시 정의해야 하는 매개변수입니다.
예를 들어 최소 인스턴스가 1, 최대 인스턴스가 10, 구동 인스턴스가 2인 경우 최초에 구동 인스턴스에 따라 2대의 인스턴스가 생성됩니다. 이후 부하에 따라 확장 또는 감축 정책이 발동하면 구동 인스턴스가 정책에 따라 늘어나거나 줄어듭니다. 참고로 구동 인스턴스는 어떤 상황에서도 최소, 최대 인스턴스로 지정된 범위를 넘어설 수는 없습니다.
Auto Scaling 정책
- 정책이란 인스턴스를 생성하거나 제거하는 기준을 정의한 것입니다. 한 개 이상의 조건과 조건이 충족했을 때의 동작으로 구성됩니다.
- 스케일링 그룹은 1분 주기로 수집
모니터링 항목 | 상세항목 |
---|---|
CPU | 사용률(%) |
Memory | 사용률(%) |
디스크 | 읽기/쓰기량 (KB/m) |
네트워크 | 송신/수신량 (KB/m) |