Skip to main content

AutoScale 서비스

AutoScale은 인스턴스의 부하 또는 장애 등과 같은 상황을 대비하여 지속적으로 모니터링하여 필요한 경우 인스턴스를 확장하거나 축소할 수 있도록 하는 클라우드 핵심 기술입니다.

AutoScale을 통해 부하와 장애에 실시간으로 대응하여 안정적이고 탄력적인 사용자 서비스를 제공할 수 있습니다.

스케일링이란 ?

스케일링이란 인스턴스 혹은 컴퓨팅 파워를 확장하는 것을 스케일링이라고 합니다.

Scale Up

현재 가지고 있는 하드웨어 장비의 성능을 높이는 것, 인스턴스 서버의 스펙을 높이는 것

NHN-Cloud_autoscale1

Scale Out

규모를 늘리는 것, 장비를 추가해서 확장하는 방식

NHN-Cloud_autoscale2

Scale In

더 이상 필요 없는 인스턴스 수를 줄이는 것

NHN-Cloud_autoscale3

Auto Scaling Group

  • 인스턴스를 추가로 생성 또는 삭제하는 조건과 조건이 만족하는 경우 수행할 행동을 정의하는 것입니다.
  • 최소, 최대, 구동 인스턴스는 스케일링 그룹에서 반드시 정의해야 하는 매개변수입니다.

NHN-Cloud_autoscale4

예를 들어 최소 인스턴스가 1, 최대 인스턴스가 10, 구동 인스턴스가 2인 경우 최초에 구동 인스턴스에 따라 2대의 인스턴스가 생성됩니다. 이후 부하에 따라 확장 또는 감축 정책이 발동하면 구동 인스턴스가 정책에 따라 늘어나거나 줄어듭니다. 참고로 구동 인스턴스는 어떤 상황에서도 최소, 최대 인스턴스로 지정된 범위를 넘어설 수는 없습니다.

Auto Scaling 정책

  • 정책이란 인스턴스를 생성하거나 제거하는 기준을 정의한 것입니다. 한 개 이상의 조건과 조건이 충족했을 때의 동작으로 구성됩니다.
  • 스케일링 그룹은 1분 주기로 수집
모니터링 항목상세항목
CPU사용률(%)
Memory사용률(%)
디스크읽기/쓰기량 (KB/m)
네트워크송신/수신량 (KB/m)
정리

최소, 최대 구동 인스턴스가 각각 1, 2, 10인 경우

  • 인스턴스 템플릿 생성, 생성시킬 인스턴스 정보 기입
  • Auto Scaling 그룹에 정책 설정을 한 후 오토 스케일링 생성
  • 구동 인스턴스 정의에 의해 두 대의 인스턴스 생성
  • 오토 스케일 서비스가 확인하는 값은 스케일링 그룹 내 모든 인스턴스 들의 평균값
  • 생성된 2대의 인스턴스를 지속적으로 모니터링하다가 증설 조건에 만족한다면 서버를 증가시키고 부하가 분산 및 감소되면서 감축 조건에 만족한다면 오래된 인스턴스부터 중지시키게 됩니다.