Azure 서비스는 특정 VM(가상 머신) SKU에 대한 사용 제한을 포함하여 리소스 및 기능에 대한 기본 제한 및 할당량을 설정합니다.
이 문서는 AKS(Azure Kubernetes Service)의 기본 리소스 한도와 Azure 지역의 Azure 가용성에 대해 자세히 설명합니다.
서비스 할당량 및 제한
리소스 | 제한 |
---|---|
전역적으로 구독당 최대 클러스터 수 | 5,000 |
Virtual Machine Scale Sets 및 표준 Load Balancer SKU를 사용하는 클러스터당 최대 노드 수 | 5,000(모든 노드 풀에서) 참고: 클러스터당 최대 5,000개의 노드를 스케일 업할 수 없는 경우 대규모 클러스터 모범 사례를 참조하세요. |
노드 풀당 최대 노드(Virtual Machine Scale Sets 노드 풀) | 1000 |
클러스터당 최대 노드 풀 | 100 |
노드당 최대 파드 수: Kubenet 네트워킹 플러그인 사용 | 최대: 250 Azure CLI 기본값: 110 Azure Resource Manager 템플릿 기본값: 110 Azure Portal 배포 기본값: 30 |
노드당 최대 Pod 수: Azure Container Networking Interface(Azure CNI)1 사용 | 최대: 250 Windows Server 컨테이너에 권장되는 최대 개수: 110개 기본값: 30 |
OSM(오픈 서비스 메시) AKS 추가 기능 | Kubernetes 클러스터 버전: AKS 지원 버전 클러스터당 OSM 컨트롤러: 1 OSM 컨트롤러당 Pod: 1600 OSM에서 관리하는 Kubernetes 서비스 계정: 160 |
표준 Load Balancer SKU를 사용하여 클러스터당 최대 부하 분산 kubernetes 서비스 유지 | 300 |
Virtual Machine Availability Sets 및 기본 Load Balancer SKU를 사용하는 클러스터당 최대 노드 수 | 100 |
1 Windows Server 컨테이너는 Azure CNI 네트워킹 플러그 인을 사용해야 합니다. Kubenet은 Windows Server 컨테이너에서 지원되지 않습니다.
Kubernetes 컨트롤 플레인 계층 | 제한 |
---|---|
표준 계층 | 부하에 따라 Kubernetes API 서버를 자동으로 스케일링합니다. 더 큰 컨트롤 플레인 구성 요소 제한 및 API 서버/등 인스턴스. |
무료 계층 | 진행 중 요청 제한으로 인해 리소스가 제한됩니다. 권장되는 노드 제한이 클러스터당 10개 노드입니다. 실험, 학습 및 간단한 테스트에 가장 적합합니다. 프로덕션/중요 워크로드에는 권장되지 않습니다. |
AKS 관리형 클러스터의 할당량 제한
2025년 9월부터 Azure Kubernetes Service는 모든 현재 및 새 AKS 고객에 대한 할당량을 사용하도록 변경 사항을 적용하기 시작합니다. 이 출시는 2025년 9월 1일부터 30일까지 진행될 예정입니다.
AKS 할당량은 Azure 구독이 지역별로 만들 수 있는 AKS 클러스터(관리형 클러스터)의 최대 수 제한을 나타냅니다. 관리형 클러스터 할당량이 릴리스되면 고객은 AKS 클러스터를 만들기 위해 관리형 클러스터에 대한 할당량과 해당 노드(VM sku)에 대한 할당량이 모두 필요합니다.
기존 AKS 고객 구독 에는 사용 가능한 지역 용량에 따라 현재 사용량 이상의 기본 제한이 제공됩니다. AKS를 처음 사용하는 기존 구독과 새 구독 에는 기본 한도가 부여됩니다.
고객은 Azure Portal 할당량 페이지 또는 할당량 REST API를 통해 할당량 제한 및 사용량을 보고추가 할당량을 요청할 수 있습니다. 롤아웃이 완료되기 전에 포털 할당량 블레이드에 할당량 제한 및 사용량이 표시될 수 있으며 고객은 할당량을 요청할 수 있습니다. 그러나 롤아웃이 완료될 때까지 제한은 적용되지 않습니다.
lightbox="./media/quotas-skus-regions/portal-quotas-page-expanded.png"
관리형 클러스터 할당량이 롤아웃되면 고객은 새 클러스터를 만들려고 시도하고 할당량이 부족하면 다음 오류가 발생합니다.
ManagedClusterCountExceedsQuotaLimit: Operation results in exceeding quota limits for managed clusters. Maximum allowed: %d, Current usage: %d, Additional requested: %d. Consider deleting unused clusters or requesting a quota increase. To request a quota increase, follow the instructions here: https://learn.microsoft.com/azure/quotas/quickstart-increase-quota-portal.
이를 해결하기 위해 고객은 Azure Portal 할당량 페이지 또는 할당량 REST API를 통해 추가 할당량을 요청할 수 있습니다.
AKS 관리형 클러스터 할당량 제한
구독 유형 | 새 구독에 대한 지역당 구독당 AKS 클러스터의 기본 수1 | Azure Portal 할당량 페이지2를 사용하여 각 지역당 구독당 AKS 클러스터의 최대 수를 셀프 서비스로 설정합니다. |
---|---|---|
기업계약 구독 | 100 | 1,000 |
CSP, 종량제, 스폰서, MSDN, MPN, Azure Pass, Azure In Open 및 Azure Pass 구독 | 10 | 100 |
무료 평가판 및 학생용 Azure 구독 | 3 | 3 |
1 새 구독에 대한 지역당 구독당 AKS 클러스터의 기본 수는 용량 제약 조건이 있는 지역에 따라 달라질 수 있습니다.
2 할당량 한도 증가를 요청하려면 Azure Portal 할당량 요청 프로세스를 사용합니다. 최대 셀프 서비스 금액을 초과하는 할당량 증가 요청에는 지원 티켓이 필요합니다. 무료 평가판 및 Azure for Students 구독은 한도 또는 할당량 증가를 받을 수 없습니다. 무료 평가판 또는 Azure for Students 구독이 있는 경우 종량제 구독으로 업그레이드하여 할당량 한도를 높일 수 있습니다.
AKS 리소스 공급자 API에 대한 제한 한도
AKS는 토큰 버킷 제한 알고리즘을 사용하여 특정 AKS 리소스 공급자 API를 제한합니다. 제한 제한은 서비스의 성능을 보장하고 모든 고객에게 서비스의 공정한 사용을 촉진합니다.
버킷은 고정 크기(버스트 속도라고도 함)를 가지며 시간이 지남에 따라 고정 속도(지속 속도라고도 함)로 리필합니다. 각 제한은 해당 지역의 지정된 리소스에 대해 지역 수준에서 적용됩니다. 예를 들어 다음 표에서 구독은 각 ResourceGroup에 대해 한 번에 최대 60번(버스트 속도)을 ListManagedClusters를 호출할 수 있지만 그 후 1초마다 1번 호출을 계속할 수 있습니다(지속적인 속도).
API 요청 | 버킷 크기 | 리필 속도 | 범위 |
---|---|---|---|
MANAGEDClusters 나열 | 요청 500회 | 1개 요청 / 1초 | Subscription |
MANAGEDClusters 나열 | 60개 요청 | 초당 1회 요청 | 리소스 그룹 |
PUT AgentPool | 요청 20회 | 1개 요청 / 1분 | AgentPool |
PUT ManagedCluster | 요청 20회 | 1개 요청 / 1분 | ManagedCluster |
GET ManagedCluster | 60개 요청 | 초당 1회 요청 | 관리형 클러스터 |
GET 작업 상태 | 200개 요청 | 2개 요청/1초 | Subscription |
기타 모든 API | 60개 요청 | 초당 1회 요청 | Subscription |
참고
ManagedClusters 및 AgentPools 버킷은 동일한 AKS 클러스터에 대해 별도로 계산됩니다.
요청이 제한되면 요청은 HTTP 응답 코드 429
(너무 많은 요청)를 반환하고 오류 코드는 응답과 같이 Throttled
표시됩니다. 제한되는 각 요청에는 다시 시도하기 전에 기다려야 하는 간격(초)과 함께 HTTP 응답 헤더에 Retry-After
가 포함됩니다. 버스트 API 호출 패턴을 사용하는 클라이언트는 Retry-After 적절하게 처리할 수 있는지 확인해야 합니다. Retry-After에 대한 자세한 내용은 다음 문서를 참조하세요. 특히 AKS는 재시도를 지정하는 데 사용합니다 delay-seconds
.
프로비전된 인프라
다른 모든 네트워크, 컴퓨팅 및 스토리지 제한은 프로비전된 인프라에 적용됩니다. 관련 한도는 Azure 구독 및 서비스 한도를 참조하세요.
중요합니다
AKS 클러스터를 업그레이드하는 경우 추가 리소스가 일시적으로 사용됩니다. 해당 리소스에는 가상 네트워크 서브넷의 사용 가능한 IP 주소나 가상 머신 vCPU 할당량이 있습니다.
Windows Server 컨테이너의 경우 업그레이드 작업을 수행하여 최신 노드 업데이트를 적용할 수 있습니다. 이러한 임시 리소스를 처리할 수 있는 IP 주소 공간 또는 vCPU 할당량이 없는 경우 클러스터 업그레이드 프로세스가 실패합니다. Windows Server 노드 업그레이드 프로세스에 대한 자세한 내용은 AKS의 노드 풀 업그레이드를 참조하세요.
지원되는 VM 크기
AKS에서 지원되는 VM 크기 목록은 Azure의 새 VM SKU 릴리스와 함께 진화하고 있습니다. AKS 릴리스 정보를 참조하여 지원되는 새로운 SKU에 대한 정보를 업데이트하세요.
제한된 VM 크기
AKS 클러스터의 각 노드에는 vCPU 및 메모리 같은 고정된 양의 컴퓨팅 리소스가 포함되어 있습니다. Kubernetes를 올바르게 실행하는 데 필요한 컴퓨팅 리소스로 인해 AKS에서 특정 VM SKU 크기가 기본적으로 제한됩니다. 이러한 제한은 Pod가 해당 노드에서 올바르게 예약되고 작동할 수 있도록 보장하기 위한 것입니다.
사용자 노드 풀
사용자 노드 풀의 경우 vCPU가 2개 미만이고 RAM(메모리)이 두 개 미만인 VM 크기는 사용되지 않을 수 있습니다.
시스템 노드 풀
시스템 노드 풀의 경우 vCPU가 2개 미만이고 RAM(메모리)이 4GB 미만인 VM 크기는 사용되지 않을 수 있습니다. 필요한 kube-system Pod 및 애플리케이션을 안정적으로 예약할 수 있도록 하려면 B 시리즈 VM 및 Av1 시리즈 VM을 사용하지 않는 것이 좋습니다.
VM 유형 및 해당 컴퓨팅 리소스에 대한 자세한 내용은 Azure의 가상 머신 크기를 참조하세요.
지원되는 컨테이너 이미지 크기
AKS는 컨테이너 이미지 크기에 대해 제한을 설정하지 않습니다. 그러나 컨테이너 이미지가 클수록 메모리 수요가 높다는 것을 이해하는 것이 중요합니다. 이 수요는 잠재적으로 리소스 제한 또는 작업자 노드의 사용 가능한 전체 메모리를 초과할 수 있습니다. 기본적으로 AKS 클러스터의 VM 크기 Standard_DS2_v2 메모리는 7GiB로 설정됩니다.
컨테이너 이미지가 큰 경우(1TiB 이상) kubelet은 디스크 공간이 부족하여 컨테이너 레지스트리에서 노드로 끌어오지 못할 수 있습니다.
지역 가용성
클러스터를 배포하고 실행할 수 있는 위치에 대한 최신 목록은 AKS 지역 가용성을 참조하세요.
스마트 VM 기본값
2025년 5월 현재 AKS는 배포 중에 매개 변수가 지정되지 않은 경우 사용 가능한 용량 및 할당량에 따라 최적의 기본 VM SKU를 자동으로 선택합니다. 이 기본값은 배포가 최상의 SKU와 일치하도록 보장하여 리소스 사용률을 최적화하면서 성능 및 안정성을 향상합니다. 이전에는 기본 AKS VM SKU가 Standard_DS2_V2, 이제는 모든 새 VM 만들기 작업에 영향을 주는 SKU 가용성을 기반으로 기본 프로비저닝에 동적 결과가 있습니다.
Azure Portal의 클러스터 구성 미리 설정
Azure Portal을 사용하여 클러스터를 만드는 경우 미리 설정된 구성을 선택하여 시나리오에 따라 빠르게 사용자 지정할 수 있습니다. 언제든지 미리 설정된 값을 수정할 수 있습니다.
미리 설정 | 설명 |
---|---|
프로덕션 표준 | AKS 권장 모범 사례를 사용하여 프로덕션 트래픽을 제공하는 대부분의 애플리케이션에 가장 적합합니다. |
개발/테스트 | 새 워크로드를 개발하거나 기존 워크로드를 테스트하는 데 가장 적합합니다. |
프로덕션 경제 | 워크로드가 중단을 허용할 수 있는 경우 비용을 의식하는 방식으로 프로덕션 트래픽을 제공하는 데 가장 적합합니다. |
프로덕션 엔터프라이즈 | 엄격한 권한과 강화된 보안 성능으로 프로덕션 트래픽을 처리하는 데 가장 적합합니다. |
프로덕션 표준 | 개발/테스트 | 프로덕션 경제 | 프로덕션 엔터프라이즈 | |
---|---|---|---|---|
시스템 노드 풀 노드 크기 | Standard_D8ds_v5 | Standard_D4ds_v5 | Standard_D8ds_v5 | Standard_D16ds_v5 |
시스템 노드 풀 자동 크기 조정 범위 | 노드 2~5개 | 노드 2~5개 | 노드 2~5개 | 노드 2~5개 |
사용자 노드 풀 노드 크기 | Standard_D8ds_v5 | - | Standard_D8as_v4 | Standard_D8ds_v5 |
사용자 노드 풀 자동 크기 조정 범위 | 노드 2~100개 | - | 0-25개 노드 | 노드 2~100개 |
프라이빗 클러스터 | - | - | - | |
가용성 영역 | - | - | ||
Azure Policy | - | - | ||
Azure Monitor | - | - | ||
비밀 저장소 CSI 드라이버 | - | - | ||
네트워크 구성 | Azure CNI 오버레이 | Azure CNI 오버레이 | Azure CNI 오버레이 | Azure CNI 오버레이 |
네트워크 정책 | 없음 | 없음 | 없음 | 없음 |
인증 및 권한 부여 | Kubernetes RBAC(역할 기반 액세스 제어)를 사용하는 로컬 계정 | Kubernetes RBAC가 있는 로컬 계정 | Azure RBAC(Azure 역할 기반 액세스 제어)를 사용한 Microsoft Entra ID 인증 | Azure RBAC를 사용한 Microsoft Entra ID 인증 |
다음 단계
특정 기본 한도 및 할당량을 늘릴 수 있습니다. 리소스에서 증가를 지원하는 경우 Azure 지원 요청을 통해 증가를 요청합니다(문제 유형에 대해 할당량 선택).
Azure Kubernetes Service