Azure Kubernetes Service の監視

Kubernetes プラットフォームは、複雑な分散システムです。 Kubernetes のデプロイを複数のレベルで監視する必要があります。 Azure Kubernetes Service (AKS) はマネージド Kubernetes サービスですが、複数のレベルでデプロイを監視するには、同じ厳しさが必要です。この記事では、AKS クラスターを監視するための概要情報とベストプラクティスについて説明します。

完全な Kubernetes スタックの詳細な監視については、 Azure サービスとクラウドネイティブツールを使用した Kubernetes クラスターの監視に関するページを参照してください。
Kubernetes クラスターからメトリックデータを収集する方法については、 Azure Monitor での Prometheus のマネージドサービスに関するページを参照してください。
Kubernetes クラスターでログを収集する方法については、「Kubernetes 監視用の Azure Monitor の機能」を参照してください。
データの視覚化については、「Azure Workbooks」と「Grafana で Azure サービスを監視する」を参照してください。

ヒント

Azure で Microsoft Copilot を使用して、Azure portal で AKS クラスターの監視を構成できます。詳細については、「 Azure で Microsoft Copilot を使用して AKS クラスターを効率的に操作する」を参照してください。

洞察

Azure の一部のサービスについては、サービスを監視するための開始点となる監視ダッシュボードが Azure portal に組み込まれています。これらのダッシュボードは、"分析情報" と呼ばれており、Azure portal の Azure Monitor の [分析情報ハブ] にあります。

Azure Monitor の Container Insights は、ノード、ポッド、コンテナー、永続ボリュームのカスタムメトリックを収集します。詳細については、「Container Insights によって収集されるメトリック」を参照してください。

Application Insights は、アプリケーションのパフォーマンスを監視するのに役立ちます。コードを変更して Application Insights を有効にするには、Azure Monitor での OpenTelemetry の有効化に関する記事をご覧ください。コードを変更しないで Application Insights を有効にするには、AKS の自動インストルメンテーションに関する記事をご覧ください。インストルメンテーションの詳細については、データ収集の基本について説明します。

データの監視

AKS では、「Azure リソースからのデータの監視」で説明されているように、他の Azure リソースと同じ種類の監視データが生成されます。 AKS によって作成されたメトリックとログの詳細については、 AKS 監視データのリファレンスを参照してください。

他の Azure サービスと機能は、他のデータを収集し、次の図と表に示すように他の分析オプションを有効にします。

source	説明
プラットフォームのメトリック	AKS クラスターのプラットフォームのメトリックは、コストなしで自動的に収集されます。これらのメトリックは、メトリックスエクスプローラーを使用して分析することも、メトリックアラートを作成するために使用することもできます。
Prometheus のメトリック	クラスターのメトリックスクレイピングを有効にすると、Azure Monitor の Prometheus のマネージドサービスによって Prometheus メトリックが収集され、 Azure Monitor ワークスペースに格納されます。 Azure Managed Grafana の事前構築済みダッシュボードと Prometheus アラートを使用して、これらのメトリックを分析します。
アクティビティログ	Azure Monitor アクティビティログは、AKS クラスターの一部のデータをコストなしで自動的に収集します。これらのログファイルは、クラスターの作成時やクラスター構成の変更などの情報を追跡します。アクティビティログデータを他のログデータと共に分析するには、アクティビティログデータを Log Analytics ワークスペースに送信します。
リソースログ	AKS のコントロールプレーンのログは、リソースログとして実装されています。 Log Analytics ワークスペースにログを送信する診断設定を作成します。ワークスペースでは、クエリを使用してログを分析し、ログ情報に基づいてアラートを設定できます。
コンテナーの分析情報	Container Insights は、クラスターからさまざまなログとパフォーマンスデータを収集し、 Log Analytics ワークスペースと Azure Monitor メトリックに格納します。 Container insights のビューやワークブック、または `stdout` と `stderr` を使用して、ストリームやストリームなどのデータを分析します。
Application Insights	Azure Monitor の機能である Application Insights は、ログ、メトリック、および分散トレースを収集します。テレメトリは、Azure portal で分析するために Log Analytics ワークスペースに格納されます。

リソースの種類

Azure では、リソースの種類と ID の概念を使用して、サブスクリプション中のすべての内容を識別します。リソースの種類は、Azure で実行されているすべてのリソースのリソース ID の一部でもあります。たとえば、Microsoft.Compute/virtualMachines は、仮想マシンのリソースの種類の 1 つです。サービスとそれに関連付けられるリソースの種類の一覧については、リソースプロバイダーに関するページを参照してください。

Azure Monitor でも同様に、リソースの種類 ("名前空間" とも呼ばれます) に基づいてコア監視データをメトリックとログに整理します。リソースの種類に応じてさまざまなメトリックとログが使用できます。サービスは、複数のリソースの種類に関連付けられる可能性があります。

AKS のリソースの種類の詳細については、 AKS 監視データのリファレンスを参照してください。

データストレージ

Azure Monitor の場合:

メトリックデータは、Azure Monitor メトリックデータベースに保存されます。
ログデータは、Azure Monitor ログストアに保存されます。 Log Analytics は、Azure portal のツールの 1 つであり、このストアに対してクエリを実行することができます。
Azure アクティビティログは、Azure portal に独自のインターフェイスを持つ別のストアです。

必要に応じて、メトリックおよびアクティビティログデータを Azure Monitor ログストアにルーティングできます。次に、Log Analytics を使用してデータのクエリを実行し、他のログデータと関連付けることができます。

多くのサービスで診断設定を使用して、メトリックとログデータを Azure Monitor の外部の他のストレージの場所に送信できます。たとえば、Azure Storage、ホステッドパートナーシステム、Event Hubs を使用する Azure 以外のパートナーシステムなどがあります。

Azure Monitor によるデータの保存方法の詳細については、「Azure Monitor データプラットフォーム」を参照してください。

Azure Monitor プラットフォームのメトリック

Azure Monitor により、ほとんどのサービスに関するプラットフォームメトリックが提供されます。これらのメトリックは次のとおりです。

名前空間ごとに個別に定義されます。
Azure Monitor 時系列メトリックデータベースに保存されます。
軽量であり、凖リアルタイムのアラートをサポートできます。
リソースのパフォーマンスを時間の経過と共に追跡するために使用されます。

収集: Azure Monitor では、プラットフォームメトリックを自動的に収集します。構成は必要ありません。

ルーティング: また、いくつかのプラットフォームメトリックを Azure Monitor ログまたは Log Analytics にルーティングして、他のログデータを使用してクエリを実行することもできます。各メトリックの DS エクスポート設定を確認して、診断設定を使用してメトリックを Azure Monitor ログまたは Log Analytics にルーティングできるかどうかを確認します。

詳細については、メトリックの診断の設定に関する記事を参照してください。
サービスの診断設定を構成する場合は、「Azure Monitor の診断設定を作成する」を参照してください。

Azure Monitor ですべてのリソースに対して収集できるすべてのメトリックの一覧については、Azure Monitor でサポートされているメトリックに関するページを参照してください。

AKS 用に収集できるメトリックの一覧については、 AKS 監視データのリファレンスを参照してください。

メトリックは、クラスターの監視、問題の特定、AKS クラスターでのパフォーマンスの最適化において重要な役割を果たします。プラットフォームメトリックは、 kube-system 名前空間にインストールされている既定のメトリックサーバーを使用してキャプチャされます。これは、kubelet によって提供されるすべての AKS ノードから定期的にメトリックをスクレイピングします。また、Prometheus メトリックのマネージドサービスを有効にして、コンテナーメトリックと Kubernetes オブジェクトメトリック (オブジェクトのデプロイ状態を含む) を収集する必要があります。

Prometheus メトリックの既定のマネージドサービスの一覧を表示できます。

詳細については、「 AKS クラスターから Prometheus メトリックのマネージドサービスを収集する」を参照してください。

AKS は、API サーバーなどの重要なコントロールプレーンコンポーネントや、Prometheus のマネージドサービスを介したスケジューラからのメトリックも公開します。現在、この機能はプレビュー段階です。詳細については、「 AKS コントロールプレーンメトリックの監視 (プレビュー)」を参照してください。 API サーバーおよび etcd のコントロールプレーンメトリックのサブセットは、 Azure Monitor プラットフォームメトリックを通じて無料で利用できます。メトリックは既定で収集され、メトリックを使用してメトリックベースのアラートを作成できます。

Azure Monitor ベース以外のメトリック

このサービスは、Azure Monitor メトリックデータベースに含まれていない他のメトリックを提供します。

次の Azure サービスと Azure Monitor 機能を使用して、AKS クラスターを監視できます。これらの機能は、AKS クラスターを作成するときに有効にします。

Azure portal で、[ 統合 ] タブを使用するか、Azure CLI、Terraform、または Azure Policy を使用します。クラスターの作成後に、クラスターを監視サービスまたは機能にオンボードできる場合があります。各サービスまたは機能にはコストが発生する可能性があるため、有効にする前に各コンポーネントの価格情報を参照してください。

サービスまたは機能	説明
コンテナーの分析情報	コンテナー化されたバージョンの Azure Monitor エージェントを使用して、クラスター内の各ノードから `stdout` および `stderr` ログと Kubernetes イベントを収集します。この機能は、AKS クラスターのさまざまな監視シナリオをサポートしています。 AKS クラスターの作成時に、 Azure CLI、 Azure Policy、Azure portal、または Terraform を使用して監視を有効にすることができます。クラスターの作成時に Container insights を有効にしない場合は、「 AKS クラスターの Container insights を有効にする」を参照して、それを有効にする他のオプションを確認してください。 Container Insights では、そのデータの大部分が Log Analytics ワークスペースに格納されます。通常、クラスターのリソースログと同じ Log Analytics ワークスペースを使用します。使用する必要があるワークスペースの数と場所のガイダンスについては、 Log Analytics ワークスペースアーキテクチャの設計に関するページを参照してください。
Azure Monitor での Prometheus のマネージドサービス	Prometheus は、Cloud Native Computing Foundation のクラウドネイティブメトリックソリューションです。これは、Kubernetes クラスターからメトリックデータを収集および分析するために使用する最も一般的なツールです。 Azure Monitor での Prometheus のマネージドサービスは、フルマネージドの Prometheus と互換性のある監視ソリューションです。クラスターの作成時に Prometheus のマネージドサービスを有効にしない場合は、 AKS クラスターから Prometheus メトリックを収集する方法に関する他のオプションを参照してください。 Azure Monitor の Prometheus のマネージドサービスは、Grafana ワークスペースにリンクされている Azure Monitor ワークスペースにそのデータを格納します。 Azure Managed Grafana を使用してデータを分析できます。
Azure Managed Grafana	Grafana のフルマネージド実装。 Grafana は、Prometheus データを表示するために一般的に使用されるオープンソースのデータ視覚化プラットフォームです。 Kubernetes の監視とフルスタックのトラブルシューティングのために、複数の定義済みの Grafana ダッシュボードを使用できます。クラスターの作成時に Azure Managed Grafana を有効にしない場合は、「 Grafana ワークスペースのリンク」を参照してください。 Azure Monitor ワークスペースにリンクして、クラスターから Prometheus メトリックにアクセスできるようにします。

AKS コントロールプレーンメトリックの監視 (プレビュー)

AKS では、API サーバーなどの重要なコントロールプレーンコンポーネントや、Azure Monitor の Prometheus のマネージドサービスを介したスケジューラからのメトリックも公開されます。現在、この機能はプレビュー段階です。詳細については、「 AKS コントロールプレーンメトリックの監視」を参照してください。 API サーバーおよび etcd のコントロールプレーンメトリックのサブセットは、 Azure Monitor プラットフォームメトリックを通じて無料で利用できます。これらのメトリックは既定で収集されます。メトリックを使用してアラートを作成できます。

Azure Monitor リソースログ

リソースログでは、Azure リソースによって実行された操作に関する分析情報を提供します。ログは自動的に生成されますが、保存するかクエリを実行するには、Azure Monitor ログにルーティングする必要があります。ログはカテゴリに分類されています。特定の名前空間に複数のリソースログカテゴリが含まれる場合があります。

収集: リソースログは、"診断設定" を作成してログを 1 つ以上の場所にルーティングするまでは収集および保存されません。診断設定を作成するときは、収集するログのカテゴリを指定します。診断設定を作成して管理するには、Azure portal、プログラム、Azure Policy など、複数の方法があります。

ルーティング: 既定で推奨されるのは、リソースログを Azure Monitor ログにルーティングして、他のログデータを使用してクエリを実行できるようにすることです。 Azure Storage、Azure Event Hubs、特定の Microsoft 監視パートナーなど、その他の場所も利用できます。詳細については、「Azure リソースログ」およびリソースログの送信先に関するページを参照してください。

リソースログの収集、保存、ルーティングの詳細については、「Azure Monitor の診断設定」を参照してください。

Azure Monitor で使用可能なすべてのリソースログカテゴリの一覧については、Azure Monitor でサポートされているリソースログに関するページを参照してください。

Azure Monitor 内のすべてのリソースログには、同じヘッダーフィールドの後にサービス固有のフィールドがあります。共通のスキーマの概要については、Azure Monitor リソースログのスキーマに関する記事をご覧ください。

使用可能なリソースログカテゴリ、関連する Log Analytics テーブル、および AKS のログスキーマについては、 AKS 監視データのリファレンスを参照してください。

AKS コントロールプレーンリソースログ

AKS クラスターのコントロールプレーンのログは、Azure Monitor のリソースログとして実装されています。リソースログは、少なくとも 1 つの場所にルーティングする診断設定を作成するまで収集および保存されません。通常、リソースログは Log Analytics ワークスペースに送信されます。このワークスペースには、Container insights のほとんどのデータが格納されます。

Azure portal、Azure CLI、または Azure PowerShell を使用して診断設定を作成する方法については、「診断設定の作成」を参照してください。診断設定を作成するときは、収集するログのカテゴリを指定します。 AKS のカテゴリは、 AKS 監視データリファレンスに記載されています。

Warnung

AKS のリソースログ (特に kube-audit ログ) を収集すると、大幅なコストが発生する可能性があります。収集されるデータの量を減らすために、次の推奨事項を検討してください。

不要な場合 kube-audit ログ記録を無効にします。
kube-audit-adminおよびget監査イベントを除外する、listからの収集を有効にします。
この記事の説明に従ってリソース固有のログを有効にし、 AKSAudit テーブルを Basic ログとして構成します。

監視に関するその他の推奨事項については、 Azure サービスとクラウドネイティブツールを使用した AKS クラスターの監視に関するページを参照してください。監視コストを削減する方法については、コストの最適化と Azure Monitor に関するページを参照してください。

AKS では、リソースログに対して Azure 診断モードまたはリソース固有モードがサポートされています。 Azure 診断モードでは、すべてのデータが AzureDiagnostics テーブルに送信されます。リソース固有モードでは、データが送信される Log Analytics ワークスペース内のテーブルを指定します。また、AKSAuditの表に示すように、データをAKSAuditAdmin、AKSControlPlane、およびに送信します。

次の理由から、AKS にはリソース固有のモードを使用することをお勧めします。

データは、AKS 専用の個々のテーブル内にあるため、クエリが簡単です。
リソース固有モードでは、コストを大幅に削減するために、基本ログとしての構成がサポートされています。

既存の設定を変更する方法など、コレクションモードの違いの詳細については、「コレクションモードの選択」を参照してください。

注

診断設定は、Azure CLI を使用して構成できます。この方法は、クラスターのプロビジョニング状態をチェックしないため、成功するとは限りません。診断設定を変更した後、クラスターに設定の変更が反映されていることを確認します。

az monitor diagnostic-settings create --name AKS-Diagnostics --resource /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourceGroups/myresourcegroup/providers/Microsoft.ContainerService/managedClusters/my-cluster --logs '[{"category": "kube-audit","enabled": true}, {"category": "kube-audit-admin", "enabled": true}, {"category": "kube-apiserver", "enabled": true}, {"category": "kube-controller-manager", "enabled": true}, {"category": "kube-scheduler", "enabled": true}, {"category": "cluster-autoscaler", "enabled": true}, {"category": "cloud-controller-manager", "enabled": true}, {"category": "guard", "enabled": true}, {"category": "csi-azuredisk-controller", "enabled": true}, {"category": "csi-azurefile-controller", "enabled": true}, {"category": "csi-snapshot-controller", "enabled": true}]'  --workspace /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourcegroups/myresourcegroup/providers/microsoft.operationalinsights/workspaces/myworkspace --export-to-resource-specific true

サンプルログクエリ

重要

AKS クラスターメニューで [ログ ] を選択すると、クエリスコープが現在のクラスターに設定された状態で Log Analytics が開きます。ログクエリには、そのリソースからのデータのみが含まれます。他のクラスターからのデータまたは他の Azure サービスのデータを含むクエリを実行するには、 Azure Monitor メニューで [ログ] を選択 します。詳細については、 Log Analytics のログクエリのスコープと時間範囲に関するページを参照してください。

クラスターの診断設定で Azure 診断モードが使用されている場合、AKS のリソースログは AzureDiagnostics テーブルに格納されます。 [カテゴリ] 列を使用してログを識別します。各カテゴリの説明については、「AKS リファレンスリソースログを」参照してください。

説明	ログクエリ
各カテゴリのログをカウントする (Azure 診断モード)	`AzureDiagnostics` \| `where ResourceType == "MANAGEDCLUSTERS"` \| `summarize count() by Category`
すべての API サーバーログ (Azure 診断モード)	`AzureDiagnostics` \| `where Category == "kube-apiserver"`
時間範囲内のすべての kube-audit ログ (Azure 診断モード)	`let starttime = datetime("2023-02-23");` `let endtime = datetime("2023-02-24");` `AzureDiagnostics` \| `where TimeGenerated between(starttime..endtime)` \| `where Category == "kube-audit"` \| `extend event = parse_json(log_s)` \| `extend HttpMethod = tostring(event.verb)` \| `extend User = tostring(event.user.username)` \| `extend Apiserver = pod_s` \| `extend SourceIP = tostring(event.sourceIPs[0])` \| `project TimeGenerated, Category, HttpMethod, User, Apiserver, SourceIP, OperationName, event`
すべての監査ログ (リソース固有モード)	`AKSAudit`
`get`および`list`監査イベントを除くすべての監査ログ (リソース固有モード)	`AKSAuditAdmin`
すべての API サーバーログ (リソース固有モード)	`AKSControlPlane` \| `where Category == "kube-apiserver"`

Log Analytics ワークスペース内の事前構築済みクエリのセットにアクセスするには、 Log Analytics クエリインターフェイスを参照し、 Kubernetes Services リソースの種類を選択します。コンテナー分析情報の一般的なクエリの一覧については、コンテナー分析情報クエリに関するページを参照してください。

AKS データプレーンコンテナー分析情報ログ

Container Insights は、コンテナーと AKS クラスターからさまざまな種類のテレメトリデータを収集し、AKS クラスターで実行されているコンテナー化されたアプリケーションの監視、トラブルシューティング、分析情報の取得に役立ちます。コンテナーの分析情報で使用されるテーブルの一覧と詳細な説明については、「Azure Monitor のテーブルリファレンス」を参照してください。ログクエリでは、すべてのテーブルを使用できます。

コスト最適化設定を使用して、Container insights エージェントを使用して収集されたメトリックデータをカスタマイズおよび制御します。この機能では、個々のテーブル選択、データ収集間隔、および名前空間のデータ収集設定をサポートし、 Azure Monitor データ収集規則 (DCR) を使用してデータ収集を除外します。これらの設定は、インジェストの量を制御し、Container Insights の監視コストを削減します。次のオプションを使用して、Azure portal で収集された Container insights データをカスタマイズできます。 [すべて] (既定値) 以外のオプションを選択すると、Container insights エクスペリエンスは使用できなくなります。

グループ化	テーブル	注記
すべて (既定値)	すべての標準コンテナー分析情報テーブル	既定の Container Insights の視覚化を有効にするために必要です。
パフォーマンス	Perf、 InsightsMetrics
ログとイベント	ContainerLog または ContainerLogV2、 KubeEvents、 KubePodInventory	Prometheus メトリックに対してマネージドサービスを有効にした場合に推奨されます。
ワークロード、デプロイメント、および HPA	InsightsMetrics、 KubePodInventory、 KubeEvents、 ContainerInventory、 ContainerNodeInventory、 KubeNodeInventory、 KubeServices
永続ボリューム	InsightsMetrics、 KubePVInventory

ログとイベントのグループ化では、ContainerLog または ContainerLogV2、KubeEvents、および KubePodInventory テーブルのログがキャプチャされますが、メトリックはキャプチャされません。メトリックを収集するための推奨パスは、AKS クラスターから Prometheus のマネージドサービスを有効にし、データの視覚化に Azure Managed Grafana を使用することです。詳細については、「Azure Monitor ワークスペースの管理」を参照してください。

ContainerLogV2 スキーマ

Azure Monitor の Container Insights には、コンテナーログの推奨スキーマ ContainerLogV2 が用意されています。この形式には、AKS および Azure Arc 対応 Kubernetes クラスターに関連するデータを表示するための一般的なクエリ用の次のフィールドが含まれています。

ContainerName
PodName
PodNamespace

このスキーマは、標準の分析ログに代わる低コストの代替手段を提供する Basic ログテーブルデータプランと互換性があります。基本的なログテーブルデータプランを使用すると、デバッグ、トラブルシューティング、監査のために、大量の詳細なログを Log Analytics ワークスペースに取り込んで格納するコストを節約できます。分析とアラートのコストには影響しません。詳細については、「Log Analytics ワークスペースのテーブルを管理する」を参照してください。

Azure Resource Manager テンプレート (ARM テンプレート)、Bicep、Terraform、Azure Policy、または Azure portal を使用してマネージド ID 認証を使用して Container Insights をオンボードする場合は、既定の ContainerLogV2 スキーマを使用することをお勧めします。クラスターの DCR または configmap を使用して ContainerLogV2 を有効にする方法の詳細については、「 ContainerLogV2 スキーマを有効にする」を参照してください。

Azure 活動ログ

アクティビティログには、各 Azure リソースの操作を、そのリソースの外部から見た視点で追跡するサブスクリプションレベルのイベント (新しいリソースの作成や仮想マシンの起動など) が含まれています。

収集: アクティビティログイベントは、Azure portal で表示するために、個別のストアに自動的に生成および収集されます。

ルーティング: アクティビティログデータを Azure Monitor ログに送信すると、他のログデータと共に分析することができます。 Azure Storage、Azure Event Hubs、特定の Microsoft 監視パートナーなど、その他の場所も利用できます。アクティビティログをルーティングする方法の詳細については、Azure アクティビティログの概要に関するページを参照してください。

AKS コンテナーのログ、イベント、ポッドのメトリックをリアルタイムで表示する

Container insights の ライブデータ 機能を使用して、AKS コンテナーのログ、イベント、ポッドのメトリックを表示します。 kubectl logs -c、kubectl getイベント、kubectl top podsに直接アクセスして、問題のトラブルシューティングをリアルタイムで行うことができます。

注

AKS では、Kubernetes クラスターレベルのログアーキテクチャが使用されます。コンテナーログは、ノードの /var/log/containers にあります。ノードにアクセスするには、「 AKS クラスターノードへの接続」を参照してください。

この機能を設定する方法については、「 Container insights でライブデータを構成する」を参照してください。この機能は、Kubernetes API に直接アクセスします。認証モデルの詳細については、 Kubernetes API を参照してください。

AKS リソースライブログを表示する

注

プライベートクラスターからログにアクセスするには、クラスターと同じプライベートネットワーク内にあるコンピューターを使用する必要があります。

Azure portal で、AKS クラスターに移動します。
[Kubernetes リソース] で、[ワークロード] を選択します。
[デプロイ]、[ポッド]、[レプリカセット]、[ステートフルセット]、[ジョブ]、または [Cron ジョブ] で値を選択し、[ライブログ] を選択します。
表示するリソースログを選択します。

次の例は、ポッドリソースのログを示しています。

ライブログを表示する

コンテナーエンジンが クラスター、 ノード、 コントローラー、またはコンテナータブで生成するときに、リアルタイムのログデータを表示できます。

Azure portal で、AKS クラスターに移動します。
[監視] で、[分析情報] を選択します。
[ クラスター]、[ ノード]、[ コントローラー]、または [コンテナー ] タブで、値を選択します。
リソースの [概要 ] ウィンドウで、[ ライブログ] を選択します。

注

Log Analytics ワークスペースのデータを表示するには、[Log Analytics のログの表示] を選択します。履歴ログ、イベント、メトリックの表示の詳細については、「 Container insights からのログのクエリ」を参照してください。

認証が成功すると、データを取得できる場合は、[ ライブログ ] タブへのストリーミングが開始されます。ログデータは、連続ストリームでここに表示されます。

次の図は、コンテナーリソースのログを示しています。

ライブイベントを表示する

コンテナーエンジンが クラスター、 ノード、 コントローラー、またはコンテナータブで生成するときに、リアルタイムのイベントデータを表示できます。

Azure portal で、AKS クラスターに移動します。
[監視] で、[分析情報] を選択します。
[ クラスター]、[ ノード]、[ コントローラー]、または [コンテナー] タブを選択し、オブジェクトを選択します。
リソースの [概要 ] ウィンドウで、[ ライブイベント] を選択します。

注

Log Analytics ワークスペースのデータを表示するには、[Log Analytics のイベントの表示] を選択します。履歴ログ、イベント、メトリックの表示の詳細については、「 Container insights からのログのクエリ」を参照してください。

認証が成功すると、データを取得できる場合は、[ ライブイベント ] タブへのストリーミングが開始されます。次の図は、コンテナーリソースのイベントを示しています。

メトリックを表示する

ポッドリソースを選択すると、コンテナーエンジンによって [ノード または コントローラー ] タブで生成されるメトリックデータをリアルタイムで表示できます。

Azure portal で、AKS クラスターに移動します。
[監視] で、[分析情報] を選択します。
[ ノード ] タブまたは [ コントローラー ] タブを選択し、ポッドオブジェクトを選択します。
リソースの [概要 ] ウィンドウで、[ ライブメトリック] を選択します。

注

認証が成功すると、データを取得できる場合は、[ ライブメトリック] タブへのストリーミングが開始されます。次の図は、ポッドリソースのメトリックを示しています。

データを表示するためのPodライブメトリックオプションを示すスクリーンショット。

監視データを分析する

監視データを分析するための多くのツールがあります。

Azure Monitor ツール

Azure Monitor では、次の基本的なツールがサポートされています。

メトリックスエクスプローラー。Azure リソースのメトリックを表示および分析できる Azure portal のツール。詳細については、「Azure Monitor メトリックスエクスプローラーを使用したメトリックの分析」を参照してください。
Log Analytics。Kusto 照会言語 (KQL) を使用して、ログデータのクエリと分析を行うことができる Azure portal のツール。詳細については、「Azure Monitor でログクエリの使用を開始する」を参照してください。
アクティビティログ。表示および基本的な検索用のユーザーインターフェイスが Azure portal に用意されています。より詳細な分析を行うには、データを Azure Monitor ログにルーティングし、Log Analytics でより複雑なクエリを実行する必要があります。

より複雑な視覚化を可能にするツールは次のとおりです。

ダッシュボードを使用すると、さまざまな種類のデータを組み合わせて、Azure portal 内の 1 つのペインに表示できます。
ブック。Azure portal で作成できるカスタマイズ可能なレポート。ブックには、テキスト、メトリック、ログクエリを含めることができます。
Grafana。運用ダッシュボードに優れたオープンプラットフォームツール。 Grafana を使用して、Azure Monitor 以外の複数のソースからのデータを含むダッシュボードを作成できます。
Power BI。さまざまなデータソースにわたって対話型の視覚化を提供するビジネス分析サービス。 Azure Monitor からログデータを自動的にインポートするように Power BI を構成して、これらの視覚化を利用できます。

Azure Monitor エクスポートツール

次の方法を使用して、Azure Monitor から他のツールにデータを取得できます。

メトリック:メトリック用 REST API を使用して、Azure Monitor メトリックデータベースからメトリックデータを抽出します。この API では、取得したデータを絞り込むためのフィルター式がサポートされています。詳細については、Azure Monitor REST API のリファレンスをご覧ください。
ログ: REST API または関連するクライアントライブラリを使用します。
もう 1 つのオプションは、ワークスペースデータのエクスポートです。

Azure Monitor 用 REST API の使用を開始するには、「Azure 監視 REST API のチュートリアル」を参照してください。

Azure portal の [概要] ウィンドウを使用して監視する

AKS クラスターリソースの [概要] ウィンドウの [監視] タブでは、Azure portal で監視データの表示をすばやく開始できます。このタブには、ノードプールごとに分割されたクラスターの一般的なメトリックが表示されるグラフが含まれます。これらのグラフのいずれかを選択して、メトリックスエクスプローラーでデータをさらに分析します。

[監視] タブには、クラスターの Prometheus と Container Insights 用の Azure マネージドサービスへのリンクも含まれています。これらのツールは、[ 監視 ] タブで有効にすることができます。また、クラスターの監視を改善するために他の機能を推奨するバナーがウィンドウの上部に表示される場合もあります。

ヒント

サブスクリプション内のすべての AKS クラスターの監視機能にアクセスするには、Azure portal のホームページで Azure Monitor を選択します。

Kusto クエリ

Azure Monitor ログまたは Log Analytics ストアにある監視データは、Kusto 照会言語 (KQL) を使用して分析できます。

重要

ポータルでサービスのメニューから [ログ] を選択すると、クエリスコープが現在のサービスに設定された状態で Log Analytics が開きます。このスコープは、ログクエリにその種類のリソースのデータのみが含まれることを意味します。他の Azure サービスのデータを含むクエリを実行する場合は、[Azure Monitor] メニューから [ログ] を選択します。詳細については、「Azure Monitor Log Analytics のログクエリのスコープと時間範囲」を参照してください。

いずれかのサービスに関する一般的なクエリの一覧については、Log Analytics クエリインターフェイスに関するページを参照してください。

警告

Azure Monitor のアラートにより、監視データで特定の状態が見つかったときに事前に通知を受け取ります。アラートにより、ユーザーが気付く前に、管理者が問題を識別して対処できます。詳細については、Azure Monitor アラートに関するページを参照してください。

Azure リソースに関する一般的なアラートのソースは数多くあります。 Azure リソースに関する一般的なアラートの例については、ログアラートクエリのサンプルに関するページを参照してください。 Azure Monitor ベースラインアラート (AMBA) サイトには、重要なプラットフォームメトリックのアラート、ダッシュボード、ガイドラインを実装するための半自動化された方法が用意されています。このサイトは、Azure ランディングゾーン (ALZ) の一部であるすべてのサービスを含む、Azure サービスの継続的に拡張されるサブセットに適用されます。

共通アラートスキーマを使用すると、Azure Monitor のアラート通知の使用を標準化できます。詳細については、「共通アラートスキーマ」を参照してください。

アラートの種類

Azure Monitor データプラットフォームでは、任意のメトリックまたはログデータソースに対してアラートを生成できます。監視するサービスと収集する監視データに応じて、さまざまな種類のアラートがあります。アラートの種類に応じて、さまざまな利点と欠点があります。詳細については、適切な種類の監視アラートの選択に関するページをご覧ください。

次の一覧では、作成できる Azure Monitor アラートの種類について説明します。

メトリックアラートでは、リソースメトリックを定期的に評価します。メトリックはプラットフォームメトリック、カスタムメトリック、メトリックに変換された Azure Monitor からのログまたは Application Insights メトリックにすることができます。メトリック警告では、複数の条件と動的しきい値を適用することもできます。
ログアラートでは、ユーザーは Log Analytics クエリを使用して、定義済みの頻度でリソースログを評価できます。
アクティビティログアラートは、定義された条件と一致する新しいアクティビティログイベントが発生したときにトリガーされます。 Resource Health アラートと Service Health アラートは、サービスとリソースの正常性を報告するアクティビティログアラートです。

一部の Azure サービスでは、スマート検出アラート、Prometheus アラート、推奨されるアラートルールもサポートされています。

一部のサービスでは、同じ Azure リージョン内に存在する同じ種類の複数のリソースに同じメトリックアラートルールを適用することで、大規模に監視することができます。監視対象リソースごとに個別の通知が送信されます。サポートされている Azure サービスとクラウドについては、「1 つのアラートルールで複数のリソースを監視する」を参照してください。

推奨されるアラートルール

一部の Azure サービスでは、推奨される既定の警告ルールを有効にすることができます。

次に基づいて、推奨されるアラートルールの一覧がシステムによってコンパイルされます。

リソースを監視するための重要なシグナルとしきい値についてのリソースプロバイダーの知識。
顧客が一般的に、このリソースの警告を何に対して行っているかを示すデータ。

注

推奨されるアラートルールは、次の場合に使用できます。

仮想マシン
Azure Kubernetes Service (AKS) リソース
Log Analytics ワークスペース

Prometheus メトリックベースのアラート

クラスターの Prometheus メトリックに対してマネージドサービスの収集を有効にすると、 Prometheus アラートルールに対して推奨されるマネージドサービスのコレクションをダウンロードできます。

ダウンロードには、次の規則が含まれています。

レベル	警告
クラスターレベル	`KubeCPUQuotaOvercommit` `KubeMemoryQuotaOvercommit` `KubeContainerOOMKilledCount` `KubeClientErrors` `KubePersistentVolumeFillingUp` `KubePersistentVolumeInodesFillingUp` `KubePersistentVolumeErrors` `KubeContainerWaiting` `KubeDaemonSetNotScheduled` `KubeDaemonSetMisScheduled` `KubeQuotaAlmostFull`
Node レベル	`KubeNodeUnreachable` `KubeNodeReadinessFlapping`
ポッドレベル	`KubePVUsageHigh` `KubeDeploymentReplicasMismatch` `KubeStatefulSetReplicasMismatch` `KubeHpaReplicasMismatch` `KubeHpaMaxedOut` `KubePodCrashLooping` `KubeJobStale` `KubePodContainerRestart` `KubePodReadyStateLow` `KubePodFailedState` `KubePodNotReadyByController` `KubeStatefulSetGenerationMismatch` `KubeJobFailed` `KubeContainerAverageCPUHigh` `KubeContainerAverageMemoryHigh` `KubeletPodStartUpLatencyHigh`

詳細については、「 Container insights からのログアラートの作成」および「 Container insights からのログのクエリ」を参照してください。

ログアラートは、次の 2 種類の情報を測定して、さまざまなシナリオを監視するのに役立ちます。

結果数: クエリによって返された行数をカウントします。この情報を使用して、Windows イベントログ、syslog イベント、アプリケーション例外などのイベントを処理します。
値の計算: 数値列に基づいて計算を行います。この情報を使用して、さまざまなリソースを含めます。たとえば、CPU の割合です。

ほとんどのログクエリでは、DateTime 演算子を使用して 1 時間前に戻ることで、now値を現在の時刻と比較します。ログベースのアラートを作成する方法については、「Container insights からログアラートを作成する」を参照してください。

AKS アラートルール

次の表に、AKS に推奨されるアラートルールをいくつか示します。これらのアラートは、単に例です。 AKS 監視データリファレンスに記載されているメトリック、ログエントリ、またはアクティビティログエントリに対してアラートを設定できます。

条件	説明
>	すべてのノードの平均 CPU 使用率がしきい値を超えたときにアラートを生成します。
>	すべてのノードの平均ワーキングセットがしきい値を超えたときにアラートを生成します。

Advisor の推奨事項

一部のサービスでは、リソースの操作中にクリティカルな条件や差し迫った変更が発生した場合は、ポータルのサービス [概要] ページにアラートが表示されます。アラートの詳細と推奨される修正は、左側のメニューの [監視] の下の [アドバイザーのレコメンデーション] に表示されます。通常の操作中、アドバイザーのレコメンデーションは表示されません。

Azure Advisor の詳細については、Azure Advisor の概要に関するページをご覧ください。

注

サービスで実行されるアプリケーションを作成または実行している場合、Azure Monitor Application Insights は他の種類のアラートを表示する場合があります。

ノードネットワークメトリック

ノードネットワークメトリックは、正常でパフォーマンスの高い Kubernetes クラスターを維持するために重要です。ネットワークトラフィックに関するデータを収集して分析することで、クラスターの操作に関する貴重な分析情報を取得し、障害やパフォーマンスの損失につながる前に潜在的な問題を特定できます。

Kubernetes バージョン 1.29 以降では、Azure Monitor が有効になっているすべてのクラスターでノードネットワークメトリックが既定で有効になっています。

次のノードネットワークメトリックは、既定で有効になっており、ノードごとに集計されます。すべてのメトリックには、ラベルクラスターとインスタンス (ノード名) が含まれます。 Azure Managed Prometheus>Kubernetes>Networking>Clusters の下にある Managed Grafana ダッシュボードを使用すると、これらのメトリックを簡単に表示できます。

ノードレベルのメトリック

次のメトリックがノードごとに集計されます。

ノードレベルのメトリック

すべてのメトリックには、次のラベルが含まれます。

cluster
instance (ノード名)

Cilium
非 Cilium

Cilium データプレーンシナリオの場合、Container Network Observability 機能は Linux に対してのみメトリックを提供します。現時点では、Windows は Container Network Observability メトリックではサポートされていません。

Cilium は、Container Network Observability で使用されるいくつかのメトリックを公開します。

指標名	説明	追加のラベル	Linux	ウィンドウズ
cilium_forward_count_total	転送されたパケット数の合計	`direction`	✅	❌
cilium_forward_bytes_total	転送されたバイト数の合計	`direction`	✅	❌
cilium_drop_count_total	破棄されたパケット数の合計	`direction`、`reason`	✅	❌
cilium_drop_bytes_total	破棄されたバイト数の合計	`direction`、`reason`	✅	❌

非 Cilium データプレーンのシナリオでは、コンテナーネットワーク監視によって Linux と Windows の両方のオペレーティングシステムのメトリックが提供されます。

注

特定されたバグのため、TCP リセットは一時的に表示されません。その結果、 networkobservability_tcp_flag_counters メトリックは公開されません。この問題の解決に積極的に取り組んでいます。

次の表は、生成されたメトリックの概要を示しています。

指標名	説明	追加のラベル	Linux	ウィンドウズ
networkobservability_forward_count	転送されたパケット数の合計	`direction`	✅	✅
networkobservability_forward_bytes	転送されたバイト数の合計	`direction`	✅	✅
networkobservability_drop_count	破棄されたパケット数の合計	`direction`、`reason`	✅	✅
networkobservability_drop_bytes	破棄されたバイト数の合計	`direction`、`reason`	✅	✅
networkobservability_tcp_state	TCP の現在アクティブなソケット数 (TCP 状態別)	`state`	✅	✅
networkobservability_tcp_connection_remote	TCP の現在アクティブなソケット数 (リモート IP/ポート別)	`address` (IP)、`port`	✅	❌
networkobservability_tcp_connection_stats	TCP 接続の統計情報 (例: 遅延 ACL、TCPKeepAlive、TCPSackFailures)	`statistic`	✅	✅
networkobservability_tcp_flag_counters	フラグ別の TCP パケット数	`flag`	❌	✅
networkobservability_ip_connection_stats	IP 接続の統計情報	`statistic`	✅	❌
networkobservability_udp_connection_stats	UDP 接続の統計情報	`statistic`	✅	❌
networkobservability_udp_active_sockets	UDP 現在アクティブなソケット数		✅	❌
networkobservability_interface_stats	インターフェイスの統計情報	InterfaceName、`statistic`	✅	✅

ノードネットワークメトリック収集の無効化

特定のノードでネットワークメトリック収集を無効にするには、それらのノードにラベル networking.azure.com/node-network-metrics=disabled を追加します。

注

Retina には operator: "Exists"effect: NoSchedule 容認があるため、NoSchedule テイントはバイパスされます。そのため、テイントの代わりにラベルを使用してスケジュールを制御します。

クラスターでノードの自動プロビジョニングおよび自動スケールを行うと、ユーザーは各ノードでフラグを手動で有効にする必要があります。

重要

クラスターでアドバンストコンテナーネットワークサービス (ACNS) が有効になっている場合、この機能は適用されません。

ノードでメトリック収集を無効にするには、次のスクリプトを使用します。

kubectl label node <node-name> networking.azure.com/node-network-metrics=disabled

ポッドレベルと DNS メトリックの詳細については、「 Advanced Container Networking Services」を参照してください。

AKS 用に作成されたメトリック、ログ、およびその他の重要な値のリファレンスについては、 AKS 監視データのリファレンスを参照してください。
Azure リソースの監視の一般的な詳細については、Azure Monitor を使用した Azure リソースの監視に関するページを参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-07-26

次の方法で共有

Azure Kubernetes Service の監視

洞察

データの監視

リソースの種類

データ ストレージ

Azure Monitor プラットフォームのメトリック

Azure Monitor ベース以外のメトリック

AKS コントロール プレーン メトリックの監視 (プレビュー)

Azure Monitor リソース ログ

AKS コントロール プレーン リソース ログ

サンプル ログ クエリ

AKS データ プレーン コンテナー分析情報ログ

ContainerLogV2 スキーマ

Azure 活動ログ

AKS コンテナーのログ、イベント、ポッドのメトリックをリアルタイムで表示する

AKS リソース ライブ ログを表示する

ライブ ログを表示する

ライブ イベントを表示する

メトリックを表示する

監視データを分析する

Azure Monitor ツール

Azure Monitor エクスポート ツール

Azure portal の [概要] ウィンドウを使用して監視する

Kusto クエリ

警告

アラートの種類

推奨されるアラート ルール

Prometheus メトリックベースのアラート

AKS アラート ルール

Advisor の推奨事項

ノード ネットワーク メトリック

ノード レベルのメトリック

ノードレベルのメトリック

ノード ネットワーク メトリック収集の無効化

関連コンテンツ

フィードバック

その他のリソース

データストレージ

AKS コントロールプレーンメトリックの監視 (プレビュー)

Azure Monitor リソースログ

AKS コントロールプレーンリソースログ

サンプルログクエリ

AKS データプレーンコンテナー分析情報ログ

AKS リソースライブログを表示する

ライブログを表示する

ライブイベントを表示する

Azure Monitor エクスポートツール

推奨されるアラートルール

AKS アラートルール

ノードネットワークメトリック

ノードレベルのメトリック

ノードネットワークメトリック収集の無効化