オートスケーリング
API의 오토스케일링 정책을 생성하고 기록을 확인하는 방법에 대해 설명합니다.
Last updated
API의 오토스케일링 정책을 생성하고 기록을 확인하는 방법에 대해 설명합니다.
Last updated
오토스케일링은 정해진 규칙에 따라 인스턴스의 수를 증가하거나 감소하는 것을 의미합니다.예를 들어, API로 1시간 동안 1,000개 이상 요청이 온 경우 인스턴스 2개를 증가시킬 수 있습니다.
스케일 조건 추가를 선택해 새로운 오토스케일 조건을 생성할 수 있습니다.
선택할 수 있는 조건들에 대해 설명합니다.
메트릭 (Metric)
인스턴스를 증감하는 기준이 되는 메트릭을 선택합니다.
총 요청 수(total_requests), 초당 요청 수(requests_per_sec) 혹은 요청 지연 시간(latency_ms) 등을 선택할 수 있습니다.
목표 값, 연산자
목표 값과 연산자를 통해 메트릭 값을 비교합니다.
예를 들어, 총 요청 수(total_requests) 메트릭에 대해 목표 값 "50"에 대해 "크거나 같은 때" 동작하도록 선택할 수 있습니다.
측정 주기
값을 가져오는 주기(기간)입니다.
예를 들어, 총 요청 수(total_requests) 메트릭에 대해 측정 주기가 "10"분인 경우 최근 10분동안 모든 요청의 수를 집계합니다.
쿨다운 (Cooldown)
오토스케일링이 동작한 이후에 일정 시간동안 추가적으로 동작하지 않는 시간입니다.
이 값을 설정하여 오토스케일링이 너무 자주 발생하지 않도록 제한할 수 있습니다.
액션
인스턴스를 증가하거나 감소하는 등 원하는 동작을 선택할 수 있습니다.
예를 들어, 실행 "인스턴스 감소" 인스턴스 개수 "1 개"를 선택했다면 지정한 메트릭에 대한 조건이 충족되었을 때, 인스턴스가 1개 감소합니다.
지정한 오토스케일링 조건이 실행되었을 때에 대한 기록 입니다. 이를 통해 언제 조건이 실행되었는지 확인할 수 있습니다.