AKS 클러스터에 대한 모니터링 활성화

2025-09-17

Azure Monitor의 Kubernetes 모니터링에 설명된 대로 Azure Monitor의 여러 기능이 함께 작동하여 AKS(Azure Kubernetes Service) 클러스터의 전체 모니터링을 제공합니다. 이 문서에서는 AKS 클러스터에 대해 다음 기능을 사용하도록 설정하는 방법을 설명합니다.

프로메테우스 지표
Managed Grafana
컨테이너 로그 기록
컨트롤 플레인 로그

필수 조건

온보딩하려면 클러스터에 대한 기여자 이상의 액세스 권한이 필요합니다.
모니터링을 사용하도록 설정한 후 데이터를 보려면 모니터링 읽기 권한자 또는 모니터링 기여자 권한이 필요합니다.

작업 영역 만들기

다음 표에서는 이 문서에서 사용하도록 설정된 Azure Monitor 기능을 지원하는 데 필요한 작업 영역을 설명합니다. 각 형식의 기존 작업 영역이 아직 없는 경우 온보딩 프로세스의 일부로 만들 수 있습니다. 만들 작업 영역 수와 배치해야 하는 위치에 대한 지침은 Log Analytics 작업 영역 아키텍처 디자인을 참조하세요.

기능	작업 영역	메모
관리되는 Prometheus	Azure Monitor 작업 영역	온보딩할 때 기존 Azure Monitor 작업 영역을 지정하지 않으면 리소스 그룹에 대한 기본 작업 영역이 사용됩니다. 기본 작업 영역이 클러스터 지역에 아직 없는 경우 `DefaultAzureMonitorWorkspace-<mapped_region>` 형식의 이름을 가진 작업 영역이 `DefaultRG-<cluster_region>`이라는 리소스 그룹에 만들어집니다. `Contributor` 권한은 추가 기능에서 데이터를 Azure Monitor 작업 영역에 보낼 수 있도록 하는 데 충분합니다. Azure Monitor 작업 영역을 연결하여 Azure Managed Grafana에서 메트릭을 보려면 `Owner` 수준 권한이 필요합니다. 온보딩 단계를 실행하는 사용자가 Azure Monitor 작업 영역에서 Azure Managed Grafana 시스템 ID `Monitoring Reader` 역할을 제공하여 메트릭을 쿼리할 수 있어야 하므로 이 권한이 필요합니다.
컨테이너 로그 기록 컨트롤 플레인 로그	Log Analytics 작업 영역	동일한 Microsoft Entra 테넌트에서 다른 Azure 구독의 Log Analytics 작업 영역에 클러스터를 연결할 수 있지만 Azure CLI 또는 Azure Resource Manager 템플릿을 사용해야 합니다. 현재 이 구성은 Azure Portal에서 수행할 수 없습니다. 기존 클러스터를 다른 구독의 Log Analytics 작업 영역에 연결하는 경우 Microsoft.ContainerService 리소스 공급자는 Log Analytics 작업 영역을 사용하여 구독에 등록되어야 합니다. 자세한 내용은 리소스 공급자 등록을 참조하세요. 기존 Log Analytics 작업 영역을 지정하지 않으면 리소스 그룹에 대한 기본 작업 영역이 사용됩니다. 기본 작업 영역이 클러스터 지역에 아직 없는 경우 `DefaultWorkspace-<GUID>-<Region>` 형식의 이름으로 만들어집니다. 기본 작업 영역에 사용할 수 있는 지원되는 매핑 쌍 목록은 Container Insights에서 지원되는 지역 매핑을 참조하세요. 네트워크 보안 경계를 사용하여 작업 영역을 구성하는 방법에 대한 지침은 네트워크 보안 경계를 사용하여 Azure Monitor 구성 을 참조하세요.
Managed Grafana	Azure Managed Grafana 작업 영역	Grafana 작업 영역을 Azure Monitor 작업 영역에 연결하여 클러스터에서 수집된 Prometheus 메트릭을 Grafana 대시보드에서 사용할 수 있도록 합니다.

Prometheus 지표 및 컨테이너 로깅 사용

클러스터에서 Prometheus 및 컨테이너 로깅을 사용하도록 설정하면 컨테이너화된 버전의 Azure Monitor 에이전트 가 클러스터에 설치됩니다. 새 클러스터 또는 기존 클러스터에서 이러한 기능을 동시에 구성하거나 각 기능을 개별적으로 사용하도록 설정할 수 있습니다.

Prometheus 메트릭 스크래핑을 사용하도록 설정하는 동시에 클러스터에 대해 Managed Grafana를 사용하도록 설정합니다. Azure Monitor 작업 영역과 Azure Managed Grafana 작업 영역을 연결하는 옵션은 Grafana 작업 영역 연결을 참조하세요.

필수 조건

클러스터는 관리 ID 인증을 사용해야 합니다.
다음 리소스 공급자는 클러스터 및 Azure Monitor 작업 영역의 구독에 등록해야 합니다.
- Microsoft.ContainerService
- Microsoft.Insights
- Microsoft.AlertsManagement (마이크로소프트 알림 관리)
- Microsoft.Monitor
Grafana 작업 영역 구독에 다음 리소스 공급자를 등록해야 합니다.
- Microsoft 대시보드 (Microsoft.Dashboard)

필수 조건

관리 ID 인증은 CLI 버전 2.49.0 이상에서 기본값입니다.
aks-preview 확장은 명령을 사용하여 az extension remove --name aks-preview해야 합니다.

프로메테우스 지표

-enable-azure-monitor-metrics 새 클러스터를 만들거나 기존 클러스터를 업데이트하여 Prometheus 메트릭을 긁어내는 메트릭 추가 기능을 설치할지에 따라 az aks create 또는 az aks update와 함께 옵션을 사용합니다. Azure Monitor의 기본 Prometheus 메트릭 구성에 설명된 구성을 사용합니다. 이 구성을 수정하려면 Prometheus용 Azure Monitor 관리 서비스에서 Prometheus 메트릭의 스크래핑 사용자 지정을 참조하세요.

다음 예제를 참조하세요.

### Use default Azure Monitor workspace
az aks create/update --enable-azure-monitor-metrics --name <cluster-name> --resource-group <cluster-resource-group>

### Use existing Azure Monitor workspace
az aks create/update --enable-azure-monitor-metrics --name <cluster-name> --resource-group <cluster-resource-group> --azure-monitor-workspace-resource-id <workspace-name-resource-id>

### Use an existing Azure Monitor workspace and link with an existing Grafana workspace
az aks create/update --enable-azure-monitor-metrics --name <cluster-name> --resource-group <cluster-resource-group> --azure-monitor-workspace-resource-id <azure-monitor-workspace-name-resource-id> --grafana-resource-id  <grafana-workspace-name-resource-id>

### Use optional parameters
az aks create/update --enable-azure-monitor-metrics --name <cluster-name> --resource-group <cluster-resource-group> --ksm-metric-labels-allow-list "namespaces=[k8s-label-1,k8s-label-n]" --ksm-metric-annotations-allow-list "pods=[k8s-annotation-1,k8s-annotation-n]"

예제

az aks create/update --enable-azure-monitor-metrics --name "my-cluster" --resource-group "my-resource-group" --azure-monitor-workspace-resource-id "/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/my-resource-group/providers/microsoft.monitor/accounts/my-workspace"

선택적 매개 변수

위의 각 명령은 다음과 같은 선택적 매개 변수를 허용합니다. 매개 변수 이름은 각각 다르지만 사용은 동일합니다.

매개 변수	이름 및 설명
주석 키	`--ksm-metric-annotations-allow-list` 리소스의 `kube_resource_annotations` 메트릭에 사용된 Kubernetes 주석 키의 쉼표로 구분된 목록입니다. 예를 들어 kube_pod_annotations는 pods 리소스에 대한 주석 메트릭입니다. 기본적으로 이 메트릭에는 이름과 네임스페이스 레이블만 포함됩니다. 더 많은 주석을 포함하려면 복수형의 리소스 이름 목록과 이를 허용할 Kubernetes 주석 키를 제공합니다. 단일 `*`는 주석을 허용하기 위해 각 리소스에 제공할 수 있지만 이 경우 성능에 심각한 영향을 줍니다. 예: `pods=[kubernetes.io/team,...],namespaces=[kubernetes.io/team],...`.
레이블 키	`--ksm-metric-labels-allow-list` 리소스의 kube_resource_labels metric kube_resource_labels 메트릭에 사용되는 추가 Kubernetes 레이블 키의 쉼표로 구분된 목록입니다. 예를 들어 kube_pod_labels는 pods 리소스에 대한 레이블 메트릭입니다. 기본적으로 이 메트릭에는 이름과 네임스페이스 레이블만 포함됩니다. 더 많은 레이블을 포함하려면 복수 형식의 리소스 이름 목록과 이를 허용할 Kubernetes 레이블 키를 제공합니다. 단일 `*`는 레이블을 허용하기 위해 각 리소스에 제공할 수 있지만 이 경우 성능에 심각한 영향을 줍니다. 예: `pods=[app],namespaces=[k8s-label-1,k8s-label-n,...],...`.
기록 규칙	`--enable-windows-recording-rules` Windows 대시보드의 적절한 작동에 필요한 기록 규칙 그룹을 사용하도록 설정할 수 있습니다.

컨테이너 로그

--addon monitoring 옵션을 사용하여 az aks create 명령어로 새 클러스터를 만들거나, az aks enable-addon 명령어를 사용하여 기존 클러스터를 업데이트하여 컨테이너 로그 수집을 사용할 수 있습니다. 로그 컬렉션 설정을 수정하려면 아래를 참조하세요.

다음 예제를 참조하세요.

### Use default Log Analytics workspace
az aks enable-addons --addon monitoring --name <cluster-name> --resource-group <cluster-resource-group-name>

### Use existing Log Analytics workspace
az aks enable-addons --addon monitoring --name <cluster-name> --resource-group <cluster-resource-group-name> --workspace-resource-id <workspace-resource-id>

### Use custom log configuration file
az aks enable-addons --addon monitoring --name <cluster-name> --resource-group <cluster-resource-group-name> --workspace-resource-id <workspace-resource-id> --data-collection-settings dataCollectionSettings.json

### Use legacy authentication
az aks enable-addons --addon monitoring --name <cluster-name> --resource-group <cluster-resource-group-name> --workspace-resource-id <workspace-resource-id> --enable-msi-auth-for-monitoring false

예제

az aks enable-addons --addon monitoring --name "my-cluster" --resource-group "my-resource-group" --workspace-resource-id "/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/my-resource-group/providers/Microsoft.OperationalInsights/workspaces/my-workspace"

로그 구성 파일

클러스터에 대한 로그 수집 설정을 사용자 지정하려면 다음 형식을 사용하여 구성을 JSON 파일로 제공할 수 있습니다. 구성 파일을 제공하지 않으면 아래 표에서 식별된 기본 설정이 사용됩니다.

{
  "interval": "1m",
  "namespaceFilteringMode": "Include",
  "namespaces": ["kube-system"],
  "enableContainerLogV2": true, 
  "streams": ["Microsoft-Perf", "Microsoft-ContainerLogV2"]
}

구성의 각 설정은 다음 표에 설명되어 있습니다.

이름	설명
`interval`	에이전트가 데이터를 수집하는 빈도를 결정합니다. 유효한 값은 1m 간격으로 1m - 30m입니다. 값이 허용되는 범위를 벗어나면 기본값은 1m입니다. 기본값: 1m.
`namespaceFilteringMode`	Include: 네임스페이스 필드의 값에서만 데이터를 수집합니다. Exclude: 네임스페이스 필드의 값을 제외한 모든 네임스페이스에서 데이터를 수집합니다. Off: 네임스페이스 선택을 무시하고 모든 네임스페이스에서 데이터를 수집합니다. 기본값: 끄기
`namespaces`	namespaceFilteringMode에 따라 인벤토리 및 성능 데이터를 수집하기 위한 쉼표로 구분된 Kubernetes 네임스페이스의 배열입니다. 예를 들어, Include 설정을 사용하는 namespaces = ["kube-system", "default"]는 이 두 네임스페이스만 수집합니다. Exclude 설정을 사용하면 에이전트는 kube-system 및 default를 제외한 다른 모든 네임스페이스에서 데이터를 수집합니다. Off 설정을 사용하면 에이전트는 kube-system 및 default를 포함한 모든 네임스페이스에서 데이터를 수집합니다. 유효하지 않거나 인식할 수 없는 네임스페이스는 무시됩니다. 없음.
`enableContainerLogV2`	ContainerLogV2 스키마를 사용하도록 설정하는 부울 플래그입니다. true로 설정하면 stdout/stderr 로그가 ContainerLogV2 테이블에 수집됩니다. 그렇지 않으면 ConfigMap에 달리 지정되지 않는 한 컨테이너 로그가 ContainerLog 테이블에 수집됩니다. 개별 스트림을 지정할 때 ContainerLog 또는 ContainerLogV2에 해당하는 테이블을 포함해야 합니다. 기본값: True
`streams`	테이블 스트림의 배열입니다. 유효한 스트림 및 해당 테이블의 목록은 Stream 값을 참조하세요. 기본값: ContainerLogV2, KubeEvents, KubePodInventory

필수 조건

Azure Monitor 작업 영역 및 Azure Managed Grafana 인스턴스가 이미 만들어져 있어야 합니다.
템플릿은 Azure Managed Grafana 인스턴스와 동일한 리소스 그룹에 배포해야 합니다.
Azure Managed Grafana 인스턴스가 Azure Monitor 작업 영역 구독 이외의 구독에 있는 경우 Microsoft.Dashboard 지침을 사용하여 Azure Monitor 작업 영역 구독을 리소스 공급자에 등록합니다.
AKS 클러스터 구독에서 User Access Administrator 역할이 있는 사용자는 템플릿을 배포하여 Monitoring Reader 역할을 직접 사용하도록 설정할 수 있습니다.

참고

현재 Bicep에는 ARM 템플릿과 같이 Azure Monitor 작업 영역에 대한 "리소스 ID" 문자열 매개 변수에 대한 Monitoring Reader 역할 할당의 범위를 명시적으로 지정할 수 있는 방법이 없습니다. Bicep은 resource | tenant 형식의 값을 예상합니다. 또한 Azure Monitor 작업 영역에 대한 REST API 사양도 없습니다.

따라서 Monitoring Reader 역할에 대한 기본 범위는 리소스 그룹에 있습니다. 역할은 예상되는 동작인 상속을 통해 동일한 Azure Monitor 작업 영역에 적용됩니다. 이 Bicep 템플릿이 배포되면 해당 리소스 그룹의 모든 Azure Monitor 작업 영역에 대한 Monitoring Reader 권한이 Grafana 인스턴스에 부여됩니다.

프로메테우스 지표

Grafana 리소스에 필요한 값 검색

Azure Managed Grafana 인스턴스가 이미 Azure Monitor 작업 영역에 연결된 경우 템플릿에 이 목록을 포함해야 합니다. 그렇지 않으면 덮어씁니다. Azure Portal의 Azure Managed Grafana 인스턴스에 대한 개요 페이지에서 JSON 보기를 선택하고 아래 샘플과 비슷한 azureMonitorWorkspaceIntegrations 값을 복사합니다. 존재하지 않는 경우 인스턴스가 Azure Monitor 작업 영역과 연결되지 않은 것입니다.

"properties": {
    "grafanaIntegrations": {
        "azureMonitorWorkspaceIntegrations": [
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_1"
            },
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_2"
            }
        ]
    }
}

템플릿 및 매개 변수 파일 다운로드 및 편집

필요한 파일을 다운로드합니다.

Bicep
- 템플릿 파일: https://aka.ms/azureprometheus-enable-bicep-template
- 매개 변수 파일: https://aka.ms/azureprometheus-enable-bicep-template-parameters
- DCRA 모듈: https://aka.ms/nested_azuremonitormetrics_dcra_clusterResourceId
- 프로필 모듈: https://aka.ms/nested_azuremonitormetrics_profile_clusterResourceId
- Azure Managed Grafana 역할 할당 모듈: https://aka.ms/nested_grafana_amw_role_assignment
JSON
- 템플릿 파일: https://aka.ms/azureprometheus-enable-arm-template
- 매개 변수 파일: https://aka.ms/azureprometheus-enable-arm-template-parameters

매개 변수 파일에서 다음 값을 편집합니다. 동일한 값 세트가 ARM 및 Bicep 템플릿 모두에 사용됩니다. 개요 페이지의 JSON 보기에서 리소스의 리소스 ID를 검색합니다.

매개 변수	값
`azureMonitorWorkspaceResourceId`	Azure Monitor 작업 영역의 리소스 ID입니다. Azure Monitor 작업 영역의 개요 페이지에 있는 JSON 보기에서 검색합니다.
`azureMonitorWorkspaceLocation`	Azure Monitor 작업 영역의 위치입니다. Azure Monitor 작업 영역의 개요 페이지에 있는 JSON 보기에서 검색합니다.
`clusterResourceId`	AKS 클러스터의 리소스 ID입니다. 클러스터의 개요 페이지에 있는 JSON 보기에서 검색합니다.
`clusterLocation`	AKS 클러스터의 위치입니다. 클러스터의 개요 페이지에 있는 JSON 보기에서 검색합니다.
`metricLabelsAllowlist`	리소스의 레이블 메트릭에서 사용할 Kubernetes 레이블 키의 쉼표로 구분된 목록입니다.
`metricAnnotationsAllowList`	리소스의 주석 메트릭에 사용할 추가 Kubernetes 레이블 키의 쉼표로 구분된 목록입니다.
`grafanaResourceId`	관리 Grafana 인스턴스의 리소스 ID입니다. Grafana 인스턴스에 대한 개요 페이지의 JSON 보기에서 검색합니다.
`grafanaLocation`	관리 Grafana 인스턴스의 위치입니다. Grafana 인스턴스에 대한 개요 페이지의 JSON 보기에서 검색합니다.
`grafanaSku`	관리 Grafana 인스턴스의 SKU. Grafana 인스턴스에 대한 개요 페이지의 JSON 보기에서 검색합니다. sku.name을 사용합니다.

템플릿 파일을 열고 파일 끝에 있는 grafanaIntegrations 속성을 Grafana 인스턴스에서 검색한 값으로 업데이트합니다. 이는 다음 샘플과 비슷합니다. 이러한 샘플에서 full_resource_id_1 및 full_resource_id_2는 이미 Azure Managed Grafana 리소스 JSON에 있었습니다. 마지막 azureMonitorWorkspaceResourceId 항목은 이미 템플릿에 있으며 매개 변수 파일에 제공된 Azure Monitor Workspace 리소스 ID에 연결하는 데 사용됩니다.

Bicep

    resource grafanaResourceId_8 'Microsoft.Dashboard/grafana@2022-08-01' = {
        name: split(grafanaResourceId, '/')[8]
        sku: {
            name: grafanaSku
        }
        identity: {
            type: 'SystemAssigned'
        }
        ___location: grafanaLocation
        properties: {
            grafanaIntegrations: {
                azureMonitorWorkspaceIntegrations: [
                    {
                        azureMonitorWorkspaceResourceId: 'full_resource_id_1'
                    }
                    {
                        azureMonitorWorkspaceResourceId: 'full_resource_id_2'
                    }
                    {
                        azureMonitorWorkspaceResourceId: azureMonitorWorkspaceResourceId
                    }
                ]
            }
        }
    }

JSON

{
    "type": "Microsoft.Dashboard/grafana",
    "apiVersion": "2022-08-01",
    "name": "[split(parameters('grafanaResourceId'),'/')[8]]",
    "sku": {
        "name": "[parameters('grafanaSku')]"
    },
    "___location": "[parameters('grafanaLocation')]",
    "properties": {
        "grafanaIntegrations": {
        "azureMonitorWorkspaceIntegrations": [
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_1"
            },
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_2"
            },
            {
                "azureMonitorWorkspaceResourceId": "[parameters('azureMonitorWorkspaceResourceId')]"
            }
        ]
        }
    }
}

Resource Manager 템플릿을 배포하는 유효한 방법을 사용하여 매개 변수 파일과 함께 템플릿을 배포합니다. 다른 방법의 예는 샘플 템플릿 배포를 참조하세요.

컨테이너 로그

필수 조건

템플릿을 클러스터와 동일한 리소스 그룹에 배포해야 합니다.

템플릿 다운로드 및 설치

템플릿 및 매개 변수 파일을 다운로드하고 편집합니다.

Bicep
- 템플릿 파일(Syslog): https://aka.ms/enable-monitoring-msi-syslog-bicep-template
- 매개 변수 파일(Syslog): https://aka.ms/enable-monitoring-msi-syslog-bicep-parameters
- 템플릿 파일(Syslog 없음): https://aka.ms/enable-monitoring-msi-bicep-template
- 매개 변수 파일(Syslog 없음): https://aka.ms/enable-monitoring-msi-bicep-parameters
ARM
- 템플릿 파일: https://aka.ms/aks-enable-monitoring-msi-onboarding-template-file
- 매개 변수 파일: https://aka.ms/aks-enable-monitoring-msi-onboarding-template-parameter-file

매개 변수	설명
`aksResourceId`	클러스터의 리소스 ID입니다.
`aksResourceLocation`	클러스터의 위치입니다.
`workspaceResourceId`	Log Analytics 작업 영역의 리소스 ID입니다.
`resourceTagValues`	클러스터의 기존 Container Insights 확장 데이터 수집 규칙(DCR)에 대해 지정된 태그 값 및 DCR의 이름입니다. 이름은 `MSCI-<clusterName>-<clusterRegion>`이며, 이 리소스는 AKS 클러스터 리소스 그룹에 만들어집니다. 처음 온보딩하는 경우 임의의 태그 값을 설정할 수 있습니다.
`enableRetinaNetworkFlowLogs`	Retina 네트워크 흐름 로그를 사용하도록 설정할지 여부를 나타내는 플래그입니다.
`enableContainerLogV2`	ContainerLogV2 스키마를 사용하도록 설정하는 부울 플래그입니다. true로 설정하면 stdout/stderr 로그가 ContainerLogV2 테이블로 전송됩니다. 그렇지 않은 경우 ConfigMap에 달리 지정하지 않는 한 컨테이너 로그가 ContainerLog 테이블로 전송됩니다. 개별 스트림을 지정할 때 ContainerLog 또는 ContainerLogV2에 해당하는 테이블을 포함해야 합니다.
`enableSyslog`	Syslog 컬렉션을 사용하도록 설정할지 여부를 지정합니다.
`syslogLevels`	Syslog 컬렉션을 사용하도록 설정하는 경우 수집할 로그 수준을 지정합니다.
`dataCollectionInterval`	에이전트가 데이터를 수집하는 빈도를 결정합니다. 유효한 값은 1m 간격으로 1m~30m입니다. 기본값은 1m입니다. 값이 허용 범위를 벗어나는 경우 기본적으로 1m으로 설정됩니다.
`namespaceFilteringModeForDataCollection`	Include: 네임스페이스 필드의 값에서만 데이터를 수집합니다. Exclude: 네임스페이스 필드의 값을 제외한 모든 네임스페이스에서 데이터를 수집합니다. Off: 네임스페이스 선택을 무시하고 모든 네임스페이스에서 데이터를 수집합니다.
`namespacesForDataCollection`	namespaceFilteringMode에 따라 인벤토리 및 성능 데이터를 수집하기 위한 쉼표로 구분된 Kubernetes 네임스페이스의 배열입니다. 예를 들어, Include 설정을 사용하는 namespaces = ["kube-system", "default"]는 이 두 네임스페이스만 수집합니다. Exclude 설정을 사용하면 에이전트는 kube-system 및 default를 제외한 다른 모든 네임스페이스에서 데이터를 수집합니다. Off 설정을 사용하면 에이전트는 kube-system 및 default를 포함한 모든 네임스페이스에서 데이터를 수집합니다. 유효하지 않거나 인식할 수 없는 네임스페이스는 무시됩니다.
`streams`	테이블 스트림의 배열입니다. 유효한 스트림 및 해당 테이블의 목록은 Stream 값을 참조하세요.
`useAzureMonitorPrivateLinkScope`	Azure Monitor에 대한 클러스터 연결에 프라이빗 링크를 사용할지 여부를 지정합니다.
`azureMonitorPrivateLinkScopeResourceId`	프라이빗 링크를 사용하는 경우 프라이빗 링크 범위의 리소스 ID입니다.

Resource Manager 템플릿을 배포하는 유효한 방법을 사용하여 매개 변수 파일과 함께 템플릿을 배포합니다. 다른 방법의 예는 샘플 템플릿 배포를 참조하세요.

필수 조건

Azure Monitor 작업 영역 및 Azure Managed Grafana 작업 영역은 이미 만들어져 있어야 합니다.
템플릿은 Azure Managed Grafana 작업 영역과 동일한 리소스 그룹에 배포되어야 합니다.
AKS 클러스터 구독에서 사용자 액세스 관리자 역할이 있는 사용자는 템플릿을 배포하여 모니터링 읽기 권한자 역할을 직접 사용하도록 설정할 수 있습니다.
Azure Managed Grafana 인스턴스가 Azure Monitor Workspaces 구독 이외의 구독에 있는 경우 Microsoft.Dashboard에 따라 리소스 공급자에 Azure Monitor Workspace 구독을 등록합니다.

Grafana 리소스에 필요한 값 검색

"properties": {
    "grafanaIntegrations": {
        "azureMonitorWorkspaceIntegrations": [
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_1"
            },
            {
                "azureMonitorWorkspaceResourceId": "full_resource_id_2"
            }
        ]
    }
}

azure_monitor_workspace_integrations의 main.tf 블록을 grafana 통합 목록으로 업데이트합니다.

  azure_monitor_workspace_integrations {
    resource_id  = var.monitor_workspace_id[var.monitor_workspace_id1, var.monitor_workspace_id2]
  }

템플릿 다운로드 및 편집

새 AKS 클러스터

AddonTerraformTemplate 아래의 모든 파일을 다운로드합니다.
올바른 매개 변수 값을 사용하여 variables.tf 파일의 변수를 편집합니다.
terraform init -upgrade을(를) 실행하여 Terraform 배포를 초기화합니다.
terraform plan -out main.tfplan을(를) 실행하여 Terraform 배포를 초기화합니다.
terraform apply main.tfplan을 실행하여 실행 계획을 클라우드 인프라에 적용합니다.

참고: 해당 값이 있는 경우에만 main.tf의 annotations_allowed 및 labels_allowed 키에 대한 변수를 전달합니다. 이러한 변수는 선택적 블록입니다.

참고

terraform 템플릿을 실행하기 전에 main.tf 파일을 적절하게 편집합니다. 템플릿을 실행하기 전에 기존 azure_monitor_workspace_integrations 값을 grafana 리소스에 추가합니다. 그렇지 않으면 이전 값이 삭제되고 배포 중에 템플릿에 있는 값으로 대체됩니다. AKS 클러스터 구독에서 '사용자 액세스 관리자' 역할이 있는 사용자는 템플릿을 배포하여 '모니터링 읽기 권한자' 역할을 직접 사용하도록 설정할 수 있습니다. 비표준 SKU를 사용하는 경우 grafanaSku 매개 변수를 편집하고, 마지막으로 Grafana 리소스의 리소스 그룹에서 이 템플릿을 실행합니다.

컨테이너 로그

새 AKS 클러스터

Syslog 컬렉션을 사용하도록 설정할지 여부에 따라 Terraform 템플릿 파일을 다운로드합니다.
- Syslog: https://aka.ms/enable-monitoring-msi-syslog-terraform
- Syslog 없음: https://aka.ms/enable-monitoring-msi-terraform
클러스터 설정에 따라 azurerm_kubernetes_cluster에서 리소스를 조정합니다.

""의 값을 바꾸도록 <>의 매개 변수를 업데이트합니다.

매개 변수	설명
`aks_resource_group_name`	리소스 그룹에 대한 AKS 개요 페이지의 값을 사용합니다.
`resource_group_location`	리소스 그룹에 대한 AKS 개요 페이지의 값을 사용합니다.
`cluster_name`	만들려는 클러스터 이름을 정의합니다.
`workspace_resource_id`	Log Analytics 작업 영역의 리소스 ID를 사용합니다.
`workspace_region`	Log Analytics 작업 영역의 위치를 사용합니다.
`resource_tag_values`	클러스터의 기존 Container Insights 확장 DCR(데이터 수집 규칙)에 지정된 기존 태그 값과 DCR 이름을 일치시킵니다. 이름이 `MSCI-<clusterName>-<clusterRegion>`과 일치하며, 이 리소스는 AKS 클러스터와 동일한 리소스 그룹에 만들어집니다. 처음 온보딩하는 경우 임의의 태그 값을 설정할 수 있습니다.
`enabledContainerLogV2`	기본 권장 ContainerLogV2를 사용하려면 이 매개 변수 값을 true로 설정합니다.
비용 최적화 매개 변수	데이터 수집 매개 변수를 참조하세요.
`streams`	데이터 수집을 위한 스트림입니다. 스트림 값을 참조하세요.
`use_azure_monitor_private_link_scope`	Azure Monitor Private Link 범위를 구성할지 여부를 나타내는 플래그입니다.
`azure_monitor_private_link_scope_resource_id`	Azure Monitor Private Link 범위의 Azure 리소스 ID입니다.

terraform init -upgrade을(를) 실행하여 Terraform 배포를 초기화합니다.
terraform plan -out main.tfplan을(를) 실행하여 Terraform 배포를 초기화합니다.
terraform apply main.tfplan을 실행하여 실행 계획을 클라우드 인프라에 적용합니다.

기존 AKS 클러스터

먼저 다음 명령을 사용하여 기존 클러스터 리소스를 가져옵니다. terraform import azurerm_kubernetes_cluster.k8s <aksResourceId>

기존 azurerm_kubernetes_cluster 리소스에 oms_agent 애드온 프로필을 추가합니다.

oms_agent {
    log_analytics_workspace_id = var.workspace_resource_id
    msi_auth_for_monitoring_enabled = true
  }

Terraform 템플릿에서 DCR 및 DCRA 리소스를 복사합니다.
terraform plan -out main.tfplan을 실행하고 변경에서 oms_agent 속성을 추가하는지 확인합니다. 참고: terraform 계획 중에 정의된 azurerm_kubernetes_cluster 리소스가 다른 경우 기존 클러스터가 삭제되고 다시 만들어집니다.
terraform apply main.tfplan을 실행하여 실행 계획을 클라우드 인프라에 적용합니다.

팁

terraform 템플릿을 실행하기 전에 main.tf 파일을 적절하게 편집합니다
클러스터를 먼저 준비해야 하므로 10분 후에 데이터 흐름이 시작됩니다.
WorkspaceID는 다음 형식과 일치해야 합니다. /subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/example-resource-group/providers/Microsoft.OperationalInsights/workspaces/workspaceValue
리소스 그룹이 이미 있는 경우 terraform 계획 전에 다음을 실행합니다. terraform import azurerm_resource_group.rg /subscriptions/<Subscription_ID>/resourceGroups/<Resource_Group_Name>

새 AKS 클러스터를 만들거나 Azure Portal의 기존 클러스터에서 Prometheus 메트릭 및 컨테이너 로그를 사용하도록 설정할 수 있습니다. 두 경우 모두 구성 환경이 동일합니다.

새 AKS 클러스터

Azure Portal에서 새 AKS 클러스터를 만들 때 모니터링 탭에서 모니터링을 구성합니다.

기존 클러스터

Azure Portal에서 클러스터로 이동합니다. 서비스 메뉴에서 모니터 를 선택한 다음 , 설정을 모니터링합니다.

구성 옵션

구성 옵션은 새 클러스터와 기존 클러스터 모두에 대해 동일합니다. 유일한 차이점은 기존 클러스터에 대한 모든 옵션을 보려면 고급 설정을 선택해야 할 수 있다는 것입니다.

Prometheus 메트릭, Grafana 및 컨테이너 로그와 이벤트가 선택됩니다. 기존 Azure Monitor 작업 영역, Grafana 작업 영역 및 Log Analytics 작업 영역이 있는 경우 해당 작업 영역이 선택됩니다.
대체 작업 영역을 선택하거나 새 작업 영역을 만들려면 고급 설정을 선택합니다. 로깅 프로필 및 클래식 프로필 설정을 사용하면 모니터링 비용을 줄이기 위해 기본 컬렉션 세부 정보를 수정할 수 있습니다. 자세한 내용은 Container Insights에서 비용 최적화 사용을 참조하세요.
구성을 선택합니다.

컨테이너 로그의 경우 수집할 로그와 빈도를 정의하는 로깅 프로필을 선택해야 합니다. 사용 가능한 프로필은 다음 표에 나와 있습니다.

비용 사전 설정	수집 빈도	네임스페이스 필터	Syslog 수집	수집된 데이터
로그 및 이벤트(기본값)	1미터	None	사용 안 함	ContainerLogV2 KubeEvents KubePodInventory (쿠베 포드 인벤토리)
시스템 로그(syslog)	1미터	None	기본 설정으로 활성화됨	모든 표준 컨테이너 인사이트 테이블
스탠다드	1미터	None	사용 안 함	모든 표준 컨테이너 인사이트 테이블
비용이 최적화된	5미터	kube-system, gatekeeper-system, azure-arc를 제외합니다.	사용 안 함	모든 표준 컨테이너 인사이트 테이블

설정을 사용자 지정하려면 수집 설정 편집을 클릭합니다. 이러한 각 설정은 다음 표에 설명되어 있습니다.

이름	설명
수집 빈도	에이전트가 데이터를 수집하는 빈도를 결정합니다. 유효한 값은 1m 간격으로 1m~30m입니다. 기본값은 1m입니다. 이 옵션은 ConfigMap을 통해 구성할 수 없습니다.
네임스페이스 필터링	비활성화: 모든 네임스페이스의 데이터를 수집합니다. Include: 네임스페이스 필드의 값에서만 데이터를 수집합니다. Exclude: 네임스페이스 필드의 값을 제외한 모든 네임스페이스에서 데이터를 수집합니다. namespaceFilteringMode에 따라 인벤토리 및 성능 데이터를 수집하기 위한 쉼표로 구분된 Kubernetes 네임스페이스의 배열입니다. 예를 들어, Include 설정을 사용하는 namespaces = ["kube-system", "default"]는 이 두 네임스페이스만 수집합니다. Exclude 설정을 사용하면 에이전트는 kube-system 및 default를 제외한 다른 모든 네임스페이스에서 데이터를 수집합니다.
수집된 데이터	수집할 Container Insights 테이블을 정의합니다. 각 그룹화에 대한 설명은 아래를 참조하세요.
ContainerLogV2 사용	ContainerLogV2 스키마를 사용하도록 설정하는 부울 플래그입니다. true로 설정하면 stdout/stderr 로그가 ContainerLogV2 테이블에 수집됩니다. 그렇지 않으면 ConfigMap에 달리 지정되지 않는 한 컨테이너 로그가 ContainerLog 테이블에 수집됩니다. 개별 스트림을 지정할 때 ContainerLog 또는 ContainerLogV2에 해당하는 테이블을 포함해야 합니다.
Syslog 수집 활성화	클러스터에서 Syslog 컬렉션을 사용하도록 설정합니다.

수집된 데이터 옵션을 선택하면 클러스터에 대해 채워진 테이블을 선택할 수 있습니다. 테이블은 가장 일반적인 시나리오별로 그룹화됩니다.

Grouping	Tables	메모
모두(기본값)	모든 표준 컨테이너 인사이트 테이블	기본 컨테이너 인사이트 시각화를 사용하도록 설정하는 데 필요합니다.
Performance	Perf, InsightsMetrics
로그 및 이벤트	ContainerLog 또는 ContainerLogV2, KubeEvents, KubePodInventory	관리 Prometheus 메트릭을 사용하도록 설정한 경우 권장됩니다.
워크로드, 배포 및 HPA	InsightsMetrics, KubePodInventory, KubeEvents, ContainerInventory, ContainerNodeInventory, KubeNodeInventory, KubeServices
지속성 볼륨	인사이트메트릭스 (InsightsMetrics), 쿠베피브이인벤토리 (KubePVInventory)

프로메테우스 지표

Azure Policy 템플릿 및 매개 변수 파일을 다운로드합니다.
- 템플릿 파일: https://aka.ms/AddonPolicyMetricsProfile
- 매개 변수 파일: https://aka.ms/AddonPolicyMetricsProfile.parameters
다음 CLI 명령을 사용하여 정책 정의를 만듭니다.

az policy definition create --name "Prometheus Metrics addon" --display-name "Prometheus Metrics addon" --mode Indexed --metadata version=1.0.0 category=Kubernetes --rules AddonPolicyMetricsProfile.rules.json --params AddonPolicyMetricsProfile.parameters.json
정책 정의가 만들어지면 Azure Portal에서 정책을 선택한 다음, 정의를 선택합니다. 만든 정책 정의를 선택합니다.
할당을 선택하고, 매개 변수 탭에서 세부 정보를 입력합니다. 검토 + 만들기를 선택합니다.
정책을 기존 클러스터에 적용하려면 정책 할당에서 해당 클러스터 리소스에 대한 수정 작업을 만듭니다.

정책이 구독에 할당되면 Prometheus가 사용하도록 설정되지 않은 새 클러스터를 만들 때마다 정책이 실행되고 배포되어 Prometheus 모니터링을 사용하도록 설정합니다.

Azure Portal

Azure Portal에 있는 정책 메뉴의 정의 탭에서 다음 세부 정보를 사용하여 정책 정의를 만듭니다.
- 정의 위치: 정책 정의를 저장해야 하는 Azure 구독입니다.
- 이름: AKS-Monitoring-Addon
- 설명: 모니터링 추가 기능을 Azure Kubernetes 클러스터에 사용하도록 설정하기 위한 Azure 사용자 지정 정책입니다.
- 범주: 드롭다운 목록에서 기존 항목 사용, Kubernetes를 차례로 선택합니다.
- 정책 규칙: 기존 샘플 JSON을 https://aka.ms/aks-enable-monitoring-custom-policy의 콘텐츠로 바꿉니다.
새 AKS 모니터링 추가 기능 정책 정의를 선택합니다.
할당을 선택하고 정책을 할당할 범위를 지정합니다.
다음을 선택하고 Log Analytics 작업 영역의 리소스 ID를 제공합니다.
선택한 범위에서 기존 AKS 클러스터에 정책을 적용하려는 경우 수정 작업을 만듭니다.
검토 + 만들기를 선택하여 정책 할당을 만듭니다.

Azure 커맨드 라인 인터페이스 (CLI)

Azure Policy 템플릿 및 매개 변수 파일을 다운로드합니다.
- 템플릿 파일: https://aka.ms/enable-monitoring-msi-azure-policy-template
- 매개 변수 파일: https://aka.ms/enable-monitoring-msi-azure-policy-parameters

다음 CLI 명령을 사용하여 정책 정의를 만듭니다.

az policy definition create --name "AKS-Monitoring-Addon-MSI" --display-name "AKS-Monitoring-Addon-MSI" --mode Indexed --metadata version=1.0.0 category=Kubernetes --rules azure-policy.rules.json --params azure-policy.parameters.json

다음 CLI 명령을 사용하여 정책 정의를 만듭니다.

az policy assignment create --name aks-monitoring-addon --policy "AKS-Monitoring-Addon-MSI" --assign-identity --identity-scope /subscriptions/<subscriptionId> --role Contributor --scope /subscriptions/<subscriptionId> --___location <___location> -p "{ \"workspaceResourceId\": { \"value\": \"/subscriptions/<subscriptionId>/resourcegroups/<resourceGroupName>/providers/microsoft.operationalinsights/workspaces/<workspaceName>\" }, \"resourceTagValues\": { \"value\": {} }, \"workspaceRegion\": { \"value\": \"<___location>\" }}"

정책이 구독에 할당된 후 컨테이너 인사이트가 활성화되지 않은 새 클러스터를 만들 때마다 정책이 실행되고 배포되어 Container Insights 모니터링을 사용하도록 설정합니다.

스트림 값

CLI 또는 ARM을 사용하여 수집할 테이블을 지정할 때 Log Analytics 작업 영역의 특정 테이블에 해당하는 스트림 이름을 지정합니다. 다음 표에는 각 테이블의 스트림 이름이 나열되어 있습니다.

참고

데이터 수집 규칙의 구조에 익숙한 경우 이 테이블의 스트림 이름은 DCR의 데이터 흐름 섹션에 지정됩니다.

스트림	컨테이너 인사이트 테이블
마이크로소프트-컨테이너인벤토리	ContainerInventory
Microsoft-ContainerLog	ContainerLog
Microsoft-ContainerLogV2	ContainerLogV2
Microsoft-ContainerLogV2-HighScale	ContainerLogV2(높은 스케일링 모드)¹
Microsoft-ContainerNodeInventory	ContainerNodeInventory
Microsoft-InsightsMetrics	InsightsMetrics
Microsoft-KubeEvents	KubeEvents
Microsoft-KubeMonAgentEvents	KubeMonAgentEvents
Microsoft-KubeNodeInventory	KubeNodeInventory
Microsoft-KubePodInventory	KubePodInventory (쿠베 포드 인벤토리)
Microsoft-KubePVInventory	KubePVInventory
Microsoft-KubeServices	KubeServices
Microsoft-Perf	Perf
Microsoft-RetinaNetworkFlowLogs	RetinaNetworkFlowLogs

¹ Microsoft-ContainerLogV2 및 Microsoft-ContainerLogV2-HighScale를 함께 사용하지 마세요. 이 경우 중복 데이터가 발생합니다.

적용 가능한 테이블 및 메트릭

컬렉션 빈도 및 네임스페이스 필터링에 대한 설정은 모든 로그 데이터에 적용되지 않습니다. 다음 표에는 Log Analytics 작업 영역의 테이블과 각각에 적용되는 설정이 나와 있습니다.

테이블 이름	간격	네임스페이스	비고
ContainerInventory	Yes	Yes
ContainerNodeInventory	Yes	아니오	Kubernetes 노드는 네임스페이스 범위 리소스가 아니므로 네임스페이스에 대한 데이터 수집 설정은 적용할 수 없습니다.
KubeNodeInventory	Yes	아니오	네임스페이스에 대한 데이터 수집 설정이 적용되지 않습니다. Kubernetes 노드는 네임스페이스 범위 리소스가 아닙니다.
KubePodInventory (쿠베 포드 인벤토리)	Yes	Yes
KubePVInventory	Yes	Yes
KubeServices	Yes	Yes
KubeEvents	아니오	Yes	간격에 대한 데이터 수집 설정은 Kubernetes 이벤트에 적용되지 않습니다.
Perf	Yes	Yes	Kubernetes 노드는 네임스페이스 범위 개체가 아니기 때문에 네임스페이스에 대한 데이터 수집 설정은 Kubernetes 노드 관련 메트릭에 적용할 수 없습니다.
InsightsMetrics	Yes	Yes	데이터 수집 설정은 container.azm.ms/kubestate, container.azm.ms/pv 및 container.azm.ms/gpu 네임스페이스를 수집하는 메트릭에만 적용됩니다.

참고

네임스페이스 필터링은 ama-logs 에이전트 레코드에 적용되지 않습니다. 따라서 kube-system 네임스페이스가 제외된 네임스페이스에 나열되더라도 ama-logs 에이전트 컨테이너에 연결된 레코드는 계속 수집됩니다.

메트릭 네임스페이스	간격	네임스페이스	비고
Insights.container/nodes	Yes	아니오	노드가 네임스페이스 범위 리소스가 아닙니다.
Insights.container/nodes	Yes	Yes
Insights.container/containers	Yes	Yes
Insights.container/persistentvolumes	Yes	Yes

특수 시나리오

특정 시나리오에 대한 구성 요구 사항은 아래 참조를 확인하세요.

프라이빗 링크를 사용하는 경우 Azure Monitor에서 Kubernetes 모니터링에 대한 프라이빗 링크 사용을 참조하세요.
네트워크 보안 경계를 사용하여 컨테이너 로깅을 사용하도록 설정하려면 Log Analytics 작업 영역을 구성하도록 네트워크 보안 경계를 사용하여 Azure Monitor 구성 을 참조하세요.
높은 확장 모드를 사용하도록 설정하려면 모니터링 추가 기능에 대해 높은 확장 모드 사용의 온보딩 프로세스를 따릅니다. Update ConfigMap에 설명된 대로 ConfigMap도 설정해야 하며, DCR 스트림을 Microsoft-ContainerLogV2에서 Microsoft-ContainerLogV2-HighScale로 변경해야 합니다.

컨트롤 플레인 로그 활성화

컨트롤 플레인 로그는 Azure Monitor에서 리소스 로그 로 구현됩니다. 이러한 로그를 수집하려면 클러스터에 대한 진단 설정을 만듭니다. 컨테이너 로그와 동일한 Log Analytics 작업 영역으로 보냅니다.

az monitor diagnostic-settings create 명령을 사용하여 Azure CLI를 사용하여 진단 설정을 만듭니다. 해당 매개 변수에 대한 설명은 이 명령의 설명서를 참조하세요.

다음 예제에서는 모든 Kubernetes 범주를 Log Analytics 작업 영역으로 보내는 진단 설정을 만듭니다. 여기에는 Microsoft.ContainerService/fleets에 대해 지원되는 리소스 로그에 나열된 특정 테이블로 로그를 보내는 리소스별 모드가 포함됩니다.

az monitor diagnostic-settings create \
--name 'Collect control plane logs' \
--resource  /subscriptions/<subscription ID>/resourceGroups/<resource group name>/providers/Microsoft.ContainerService/managedClusters/<cluster-name> \
--workspace /subscriptions/<subscription ID>/resourcegroups/<resource group name>/providers/microsoft.operationalinsights/workspaces/<log analytics workspace name> \
--logs '[{"category": "karpenter-events","enabled": true},{"category": "kube-audit","enabled": true},
{"category": "kube-apiserver","enabled": true},{"category": "kube-audit-admin","enabled": true},{"category": "kube-controller-manager","enabled": true},{"category": "kube-scheduler","enabled": true},{"category": "cluster-autoscaler","enabled": true},{"category": "cloud-controller-manager","enabled": true},{"category": "guard","enabled": true},{"category": "csi-azuredisk-controller","enabled": true},{"category": "csi-azurefile-controller","enabled": true},{"category": "csi-snapshot-controller","enabled": true},{"category": "fleet-member-agent","enabled": true},{"category": "fleet-member-net-controller-manager","enabled": true},{"category": "fleet-mcs-controller-manager","enabled": true}]'
--metrics '[{"category": "AllMetrics","enabled": true}]' \
--export-to-resource-specific true

다음은 컨트롤 플레인 로그에 대한 진단 설정을 만드는 샘플 템플릿 및 매개 변수 파일입니다. 다른 범주를 수집하거나 로그를 다른 대상으로 보내도록 템플릿을 수정합니다.

Bicep

param clusterName string
param workspaceId string
param settingName string

resource cluster 'Microsoft.ContainerService/managedClusters@2021-05-01-preview' existing = {
  name: clusterName
}

resource setting 'Microsoft.Insights/diagnosticSettings@2021-05-01-preview' = {
  name: settingName
  scope: cluster
  properties: {
    workspaceId: workspaceId
    logs: [
      {
        category: 'kube-apiserver'
        enabled: true
      }
      {
        category: 'kube-audit'
        enabled: true
      }
      {
        category: 'kube-audit-admin'
        enabled: true
      }
      {
        category: 'kube-controller-manager'
        enabled: true
      }
      {
        category: 'kube-scheduler'
              }
      {
        category: 'cluster-autoscaler'
        enabled: true
      }
      {
        category: 'guard'
        enabled: true
      }
    ]
  }
}

JSON

{
    "$schema": "https://schema.management.azure.com/schemas/2019-04-01/deploymentTemplate.json#",
    "contentVersion": "1.0.0.0",
    "parameters": {
        "clusterName": {
            "type": "String"
        },
        "workspaceId": {
            "type": "String"
        },
        "settingName": {
            "type": "String"
        }
    },
    "resources": [
        {
            "type": "Microsoft.Insights/diagnosticSettings",
            "apiVersion": "2021-05-01-preview",
            "scope": "[format('Microsoft.ContainerService/managedClusters/{0}', parameters('clusterName'))]",
            "name": "[parameters('settingName')]",
            "properties": {
                "workspaceId": "[parameters('workspaceId')]",
                "logs": [
                    {
                        "category": "kube-apiserver",
                        "enabled": true
                    },
                    {
                        "category": "kube-audit",
                        "enabled": true
                    },
                    {
                        "category": "kube-audit-admin",
                        "enabled": true
                    },
                    {
                        "category": "kube-controller-manager",
                        "enabled": true
                    },
                    {
                        "category": "kube-scheduler",
                        "enabled": false
                    },
                    {
                        "category": "cluster-autoscaler",
                        "enabled": true
                    },
                    {
                        "category": "guard",
                        "enabled": true
                    }
                ]
            }
        }
    ]
}

매개 변수 파일

{
  "$schema": "https://schema.management.azure.com/schemas/2019-04-01/deploymentParameters.json#",
  "contentVersion": "1.0.0.0",
  "parameters": {
    "settingName": {
        "value": "<cluster-name>"
    },
    "workspaceId": {
      "value": "/subscriptions/<subscription id>/resourcegroups/<resourcegroup name>/providers/microsoft.operationalinsights/workspaces/<workspace name>"
    },
    "scope": {
      "value": "Microsoft.<resource type>/<resourceName>"
    }
  }
}

다음 템플릿을 사용하여 컨트롤 플레인 로그에 대한 진단 설정을 만듭니다. 다른 범주를 수집하거나 로그를 다른 대상으로 보내도록 템플릿을 수정합니다.

  features {}
}

variable "setting_name" {
  type        = string
  description = "Name for the diagnostic setting."
}

variable "workspace_id" {
  type        = string
  description = "Resource ID of the Log Analytics workspace."
}

variable "cluster_id" {
  type        = string
  description = "Resource ID of the AKS cluster to attach diagnostics to."
}

resource "azurerm_monitor_diagnostic_setting" "aks" {
  name                       = var.setting_name
  target_resource_id         = var.cluster_id
  log_analytics_workspace_id = var.workspace_id

  log {
    category = "kube-apiserver"
    enabled  = true
  }

  log {
    category = "kube-audit"
    enabled  = true
  }

  log {
    category = "kube-audit-admin"
    enabled  = true
  }

  log {
    category = "kube-controller-manager"
    enabled  = true
  }

  log {
    category = "kube-scheduler"
    enabled  = false
  }

  log {
    category = "cluster-autoscaler"
    enabled  = true
  }

  log {
    category = "guard"
    enabled  = true
  }
}

Windows 메트릭 사용(미리 보기)

AKS 클러스터에서 Windows 메트릭 수집은 관리형 Prometheus 애드온 컨테이너 버전 6.4.0-main-02-22-2023-3ee44b9e부터 활성화됩니다. Azure Monitor Metrics 추가 기능에 온보딩하면 Windows DaemonSet Pod가 노드 풀에서 실행되기 시작할 수 있습니다. Windows Server 2019 및 Windows Server 2022가 모두 지원됩니다. Pod가 Windows 노드 풀에서 메트릭을 수집하도록 사용하도록 설정하려면 다음 단계를 따릅니다.

참고

CPU/메모리 제한이 windows-exporter-daemonset.yaml 없으므로 Windows 노드를 과도하게 프로비전할 수 있습니다. 자세한 내용은 리소스 예약을 참조하세요.

워크로드를 배포할 때 리소스 메모리 및 CPU 제한을 컨테이너에 설정합니다. 또한 이는 NodeAllocatable에서 제외하고 클러스터 전역 스케줄러가 특정 Pod를 선택하고 이를 어느 노드에 배치할지 결정하는 데 도움이 됩니다. 제한 없이 Pod를 예약하면 Windows 노드가 오버프로비전될 수 있으며 극단적인 경우 노드가 비정상 상태가 될 수 있습니다.

Windows 내보내기 설치

windows-exporter-daemonset YAML 파일을 배포하여 Windows 메트릭에 액세스하기 위해 AKS 노드에 Windows 내보내기를 수동으로 설치합니다. 다음 수집기를 사용하도록 설정합니다. 더 많은 수집기를 보려면 Windows 메트릭용 Prometheus exporter를 참조하세요.

[defaults]
container
memory
process
cpu_info

windows-exporter-daemonset YAML 파일을 배포합니다. 노드에 테인트가 적용된 경우 적절한 톨러레이션 오차를 적용해야 합니다.

kubectl apply -f windows-exporter-daemonset.yaml

Windows 메트릭 사용

메트릭 설정 ConfigMap에서 windowsexporter 및 windowskubeproxy 부울 값을 true로 설정하고 클러스터에 적용합니다. ConfigMap을 사용하여 Kubernetes 클러스터에서 Prometheus 메트릭 컬렉션 사용자 지정을 참조하세요.

기록 규칙 사용

기본 제공 대시보드에 필요한 기록 규칙을 사용하도록 설정합니다.

CLI를 사용하여 온보딩하는 경우 옵션을 --enable-windows-recording-rules포함합니다.
ARM 템플릿, Bicep 또는 Azure Policy를 사용하여 온보딩하는 경우 매개 변수 파일에서 enableWindowsRecordingRules를 true로 설정합니다.
클러스터가 이미 온보딩된 경우 이 ARM 템플릿과 이 매개 변수 파일을 사용하여 규칙 그룹을 만듭니다. 이렇게 하면 필요한 기록 규칙이 추가되고 클러스터에서 ARM 작업이 아니며 클러스터의 현재 모니터링 상태에 영향을 주지 않습니다.

배포 확인

kubectl 명령줄 도구를 사용하여 에이전트가 제대로 배포되었는지 확인합니다.

관리되는 Prometheus

DaemonSet가 Linux 노드 풀에 제대로 배포되었는지 확인

kubectl get ds ama-metrics-node --namespace=kube-system

Pod 수는 클러스터의 Linux 노드 수와 같아야 합니다. 출력은 다음 예와 유사해야 합니다.

User@aksuser:~$ kubectl get ds ama-metrics-node --namespace=kube-system
NAME               DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
ama-metrics-node   1         1         1       1            1           <none>          10h

Windows 노드가 제대로 배포되었는지 확인

kubectl get ds ama-metrics-win-node --namespace=kube-system

Pod 수는 클러스터의 Windows 노드 수와 같아야 합니다. 출력은 다음 예와 유사해야 합니다.

User@aksuser:~$ kubectl get ds ama-metrics-node --namespace=kube-system
NAME                   DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
ama-metrics-win-node   3         3         3       3            3           <none>          10h

Prometheus에 대해 두 개의 ReplicaSet가 배포되었는지 확인

kubectl get rs --namespace=kube-system

출력은 다음 예와 유사해야 합니다.

User@aksuser:~$kubectl get rs --namespace=kube-system
NAME                            DESIRED   CURRENT   READY   AGE
ama-metrics-5c974985b8          1         1         1       11h
ama-metrics-ksm-5fcf8dffcd      1         1         1       11h

컨테이너 로그 기록

DaemonSet가 Linux 노드 풀에 제대로 배포되었는지 확인

kubectl get ds ama-logs --namespace=kube-system

Pod 수는 클러스터의 Linux 노드 수와 같아야 합니다. 출력은 다음 예와 유사해야 합니다.

User@aksuser:~$ kubectl get ds ama-logs --namespace=kube-system
NAME       DESIRED   CURRENT   READY     UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
ama-logs   2         2         2         2            2           <none>          1d

Windows 노드가 제대로 배포되었는지 확인

kubectl get ds ama-logs-windows --namespace=kube-system

Pod 수는 클러스터의 Windows 노드 수와 같아야 합니다. 출력은 다음 예와 유사해야 합니다.

User@aksuser:~$ kubectl get ds ama-logs-windows --namespace=kube-system
NAME                   DESIRED   CURRENT   READY     UP-TO-DATE   AVAILABLE   NODE SELECTOR     AGE
ama-logs-windows           2         2         2         2            2       <none>            1d

컨테이너 로깅 솔루션 배포 확인

kubectl get deployment ama-logs-rs --namespace=kube-system

출력은 다음 예와 유사해야 합니다.

User@aksuser:~$ kubectl get deployment ama-logs-rs --namespace=kube-system
NAME          READY   UP-TO-DATE   AVAILABLE   AGE
ama-logs-rs   1/1     1            1           24d

CLI를 사용하여 구성 보기

aks show 명령을 사용하여 솔루션 사용 여부, Log Analytics 작업 영역 리소스 ID 및 클러스터에 대한 요약 정보를 확인합니다.

az aks show --resource-group <resourceGroupofAKSCluster> --name <nameofAksCluster>

이 명령은 솔루션에 대한 JSON 형식 정보를 반환합니다. addonProfiles 섹션에는 다음 예제와 같이 omsagent에 대한 정보가 포함됩니다.

"addonProfiles": {
    "omsagent": {
        "config": {
            "logAnalyticsWorkspaceResourceID": "/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourcegroups/my-resource-group/providers/microsoft.operationalinsights/workspaces/my-workspace",
            "useAADAuth": "true"
        },
        "enabled": true,
        "identity": null
    },
}

다음 단계

온보딩을 시도하는 동안 문제가 발생하는 경우 문제 해결 가이드를 검토하세요.
Azure Portal의 Container insights에서 Kubernetes 모니터링 데이터를 분석하는 방법을 알아봅니다.

피드백

이 페이지가 도움이 되었나요?

다음을 통해 공유

AKS 클러스터에 대한 모니터링 활성화

필수 조건

작업 영역 만들기

Prometheus 지표 및 컨테이너 로깅 사용

필수 조건

필수 조건

프로메테우스 지표

선택적 매개 변수

컨테이너 로그

로그 구성 파일

스트림 값

적용 가능한 테이블 및 메트릭

특수 시나리오

컨트롤 플레인 로그 활성화

Windows 메트릭 사용(미리 보기)

Windows 내보내기 설치

Windows 메트릭 사용

기록 규칙 사용

배포 확인

관리되는 Prometheus

컨테이너 로그 기록

다음 단계

피드백

추가 리소스