Azure Monitor とクラウドネイティブツールを使用して Kubernetes クラスターを監視する

2025-09-17

Azure Monitor での Kubernetes 監視では、Kubernetes 環境とその上で実行されるワークロードの完全な監視を提供するために使用される Azure Monitor サービスについて説明します。この記事では、これらのサービスを利用して、それらを管理する一般的なロールに基づいて Kubernetes 環境のさまざまなレイヤーを監視する方法のベストプラクティスについて説明します。

インフラストラクチャレイヤーからアプリケーションまで、一般的な Kubernetes 環境の共通モデルを次に示します。各レイヤーには、異なるサービスで対処され、通常は組織内のさまざまなロールによって管理される個別の監視要件があります。

Kubernetes 環境のさまざまなレイヤーと、それに依存するアプリケーションに対する責任は、通常、複数のロールによって対処されます。組織内のサイズによっては、これらのロールは、異なるユーザーやチームによって実行される場合があります。次の表では、さまざまなロールについて説明しますが、以下のセクションでは、それぞれが通常発生する監視シナリオを示します。

役割	説明
開発者	クラスター上で実行されているアプリケーションを開発し、維持します。アプリケーションのパフォーマンスや失敗など、アプリケーション固有のトラフィックを担当します。 SLA に従ってアプリケーションの信頼性を維持します。
プラットフォームエンジニア	Kubernetes クラスターを担当します。開発者が使用するプラットフォームをプロビジョニングし、維持します。
ネットワークエンジニア	ワークロード間のトラフィックおよびクラスターへのイングレス/エグレスのトラフィックを管理します。ネットワークトラフィックを分析し、脅威分析を実行します。

ネットワークエンジニア

ネットワークエンジニアは、ワークロードとクラスターのイングレス/エグレスとの間のトラフィックを担当します。ネットワークトラフィックを分析し、脅威分析を実行します。

監視レベル 1 - ネットワーク

ネットワークを監視するための一般的なシナリオを次に示します。

Network Watcher を使用してフローログを作成し、クラスターによって使用されるネットワークセキュリティグループを通過する IP トラフィックに関する情報をログに記録し、トラフィック分析を使用してこのデータに関する分析情報を提供します。コンテナーログとコントロールプレーンログに使用するトラフィック分析には、同じ Log Analytics ワークスペースを使用します。
トラフィック分析を使用して、クラスターで使用される予期しないポートとの間でトラフィックが流れているかどうか、および公開すべきでないパブリック IP 経由でトラフィックが流れているかどうかを判断します。この情報を使用して、ネットワークルールを変更する必要があるかどうかを判断します。
AKS クラスターの場合は、AKS のネットワーク監視機能アドオン (プレビュー) を使用して、クラスター内のサービス (東西のトラフィック) 間のアクセスを監視します。

プラットフォームエンジニア

プラットフォームエンジニア (クラスター管理者とも呼ばれます) は、Kubernetes クラスター自体を担当します。開発者が使用するプラットフォームをプロビジョニングして維持します。クラスターとそのコンポーネントの正常性を把握し、検出された問題をトラブルシューティングできるようにする必要があります。また、クラスターを運用するためのコストを把握し、さまざまなチームにコストを割り当てることができるようにすることも必要です。

大規模な組織には、プラットフォームエンジニアに似ているものの、複数のクラスターを担当するフリートアーキテクトがいる場合もあります。環境全体を視覚化することが必要であり、大規模な管理タスクを実行する必要があります。次に示すガイダンスには大規模な推奨事項が含まれています。マルチクラスターおよび大規模なシナリオ用のフリートリソースの作成について詳しくは、「Azure Kubernetes Fleet Manager とは?」をご覧ください。

プラットフォームエンジニアの監視を構成する

以下のセクションでは、コンテナーレベルの Azure サービスを使用して Kubernetes 環境を監視する手順を示します。機能と統合のオプションは、特定の要件を満たすためにこの構成を変更する必要がある場所を決定するのに役立ちます。 Managed Prometheus とコンテナーのログ記録のオンボードは、「 Kubernetes クラスターの監視を有効にする」で説明されているのと同じエクスペリエンスの一部になります。以下のセクションでは、それぞれのオンボードと構成のオプションをすべて考慮できるように、それぞれについて個別に説明します。

Prometheus メトリックのスクレイピングを有効にする

重要

Prometheus 用 Azure Monitor マネージドサービスを使用するには、Azure Monitor ワークスペースが必要です。ワークスペース構成の設計上の考慮事項については、Azure Monitor のワークスペースのアーキテクチャを参照してください。

Prometheus の Azure Monitor マネージドサービスによる Prometheus メトリックの作成時または既存のクラスターへの追加時に、クラスターからの Prometheus メトリックのスクレイピングを有効にします。詳細については、「 Prometheus メトリックを有効にする」を参照してください。

AKS クラスターに使用する Prometheus 環境が既にある場合は、Prometheus の Azure Monitor マネージドサービスを有効にしてから、リモート書き込みを使用して既存の Prometheus 環境にデータを送信します。リモート書き込みを使用して、既存のセルフマネージド Prometheus 環境から Prometheus 用の Azure Monitor マネージドサービスにデータを送信することもできます。

既定で収集されるメトリックとその収集頻度に関する詳細については、「Azure Monitor での既定の Prometheus メトリック構成」を参照してください。構成をカスタマイズする場合は、「Prometheus の Azure Monitor マネージドサービスで Prometheus メトリックのスクレイピングをカスタマイズする」を参照してください。

Prometheus データの分析で Grafana を有効にする

メモ

Grafana を含む Azure Monitor ダッシュボードは現在パブリックプレビュー段階であり、Managed Grafana を置き換えることができます。このバージョンの Grafana にはコストがなく、構成も必要なく、Azure portal にダッシュボードが表示されます。複数のデータソースのデータを結合するダッシュボードを作成する場合、または既存の Grafana 環境と統合する場合は、Managed Grafana を使用します。

データソースとして Prometheus データを使用できるようにするために、Managed Grafana のインスタンスを作成し、Azure Monitor ワークスペースにリンクします。 Azure Monitor の Prometheus 用マネージドサービスをデータソースとして追加して、この構成を手動で実行することもできます。 Kubernetes クラスターの監視には、Container insights ビューと同様の情報を表すダッシュボードなど、さまざまな事前構築済みダッシュボードを使用できます。

既存の Grafana 環境がある場合は、引き続き使用して、Prometheus の Azure Monitor マネージドサービスをデータソースとして追加できます。 Azure Monitor データソースを Grafana に追加して、Container insights で収集されたデータをカスタム Grafana ダッシュボードで使用することもできます。 Container insights のビューとレポートを使用するのではなく、Grafana ダッシュボードに重点を置く場合は、この構成を実行します。

コンテナーログの収集を有効にする

重要

Prometheus に Azure Monitor マネージドサービスを使用するには、 Log Analytics ワークスペースが必要です。ワークスペース構成の設計上の考慮事項については、Azure Monitor のワークスペースのアーキテクチャを参照してください。

Kubernetes クラスターのコンテナーログの収集を有効にすると、Azure Monitor は、Kusto クエリ言語 (KQL) を使用して分析できる Azure Monitor の Log Analytics ワークスペースに stdout/stderr とインフラストラクチャログを送信する、コンテナー化されたバージョンの Azure Monitor エージェントをデプロイします。

Kubernetes クラスターをオンボードするための前提条件と構成オプションについては、「 AKS クラスターの監視を有効にする」を参照してください。 Azure Policy を使用してオンボードし、すべてのクラスターが一貫した構成を維持するようにします。

クラスターに対してコンテナーログが有効になったら、次のアクションを実行してインストールを最適化します。

不定期のトラブルシューティングにのみログを使用する場合は、この表を基本ログとして構成することを検討してください。
収集されるデータの量を減らして、Container Insights のデータインジェストのコストを削減するには、Container Insights でのコスト最適化設定の有効化に関する記事で説明されているコストプリセットを使います。多くのメトリック値は Prometheus と同じなので、ログとイベントのみを収集するように Container Insights を構成して、メトリックの収集を無効にします。

ログ収集用の既存のソリューションがある場合は、そのツールのガイダンスに従うか、Azure Monitor でログ収集を有効にし、 Log Analytics ワークスペースのデータエクスポート機能を使用して Azure Event Hubs にデータを送信し、別のシステムに転送します。

AKS クラスターのコントロールプレーンログを収集する

AKS コントロールプレーンコンポーネントのログは、リソースログとして Azure に実装されます。 AKS リソースログを Log Analytics ワークスペースに送信するには、各 AKS クラスターの診断設定を作成します。 Azure Policy を使用して、複数のクラスター間で一貫した構成を確保します。

リソースログをワークスペースに送信するにはコストがかかるため、使うログカテゴリのみを収集する必要があります。 AKS で使用できるカテゴリの説明については、「リソースログ」を参照してください。最初は最小限の数のカテゴリを収集することから始め、ニーズの増加と関連するコストの理解に応じて、診断設定を変更して追加のカテゴリを収集します。コンプライアンス上の理由で情報を保持する必要がある場合は、Azure Storage アカウントにログを送信してコストを削減できます。ログデータの取り込みと保持のコストの詳細については、Azure Monitor Logs の料金の詳細に関する記事を参照してください。

最初に有効にするリソースログがわからない場合は、最も一般的な顧客の要件に基づく次の推奨事項を使用します。必要に応じて、後で他のカテゴリを有効にできます。

カテゴリ	有効にするかどうか	宛先
kube-apiserver	有効化	Log Analytics ワークスペース
kube-audit	有効化	Azure ストレージ。これにより、コストを最小限に抑えながら、監査ログが監査担当者に必要な場合は維持します。
kube-audit-admin	有効化	Log Analytics ワークスペース
kube-controller-manager	有効化	Log Analytics ワークスペース
kube-scheduler（キューブスケジューラー）	無効にする
クラスターオートスケーラー	自動スケーリングが有効になっている場合は有効化	Log Analytics ワークスペース
ガード	Microsoft Entra ID が有効な場合は有効にする	Log Analytics ワークスペース
AllMetrics	Managed Prometheus でメトリックが収集されるため、無効にする	Log Analytics ワークスペース

ログ収集用の既存のソリューションがある場合は、そのツールのガイダンスに従うか、Azure Monitor でログ収集を有効にし、 Log Analytics ワークスペースのデータエクスポート機能を使用して Azure イベントハブにデータを送信し、別のシステムに転送します。

AKS クラスターのアクティビティログを収集する

AKS クラスターに対する構成の変更は、アクティビティログに格納されます。診断設定を作成して、このデータを Log Analytics ワークスペースに送信し、他の監視データと一緒に分析します。このデータ収集にはコストはかからず、Log Analytics を使用してデータを分析またはアラートできます。

モニターレベル 2 - クラスターレベルのコンポーネント

クラスターレベルには、次のコンポーネントが含まれます。

コンポーネント	監視の要件
Node	各ノードの CPU、メモリ、ディスク、IP 使用の準備状態とパフォーマンスを理解し、ワークロードをデプロイする前に、それらの使用状況の傾向を予防的に監視します。

クラスターレベルのコンポーネントを監視するための一般的なシナリオを次に示します。

Azure Portal

Azure portal の統合監視ダッシュボードを使用して、CPU とメモリの使用率など、クラスター内のノードのパフォーマンスを確認します。
[ノード] ビューを使って、各ノードの正常性と、そこで実行されているポッドの正常性とパフォーマンスを確認します。ノードの正常性とパフォーマンスの分析の詳細については、 Azure portal での Kubernetes クラスターのパフォーマンスの分析に関するページを参照してください。
[レポート] では、[Node Monitoring] (ノードの監視) ブックを使って、ディスク容量、ディスク IO、GPU 使用率を分析します。これらのワークブックの詳細については、「ノード監視ワークブック」を参照してください。
[監視] で [ワークブック] を選び、次に [Subnet IP Usage] (サブネット IP の使用状況) を選択し、選択した時間範囲における各ノードの IP 割り当てと配置を確認します。

Grafana ダッシュボード

Kubelet 用 Managed Grafana の事前構築済みダッシュボードを使用して、それぞれの正常性とパフォーマンスを確認します。
や node_disk_io_time_seconds_total などのディスクに関連する windows_logical_disk_free_bytesを含む Grafana ダッシュボードを使用して、アタッチされたストレージを監視します。
Prometheus に格納されているデータに基づいてノードのパフォーマンスと正常性を視覚化する複数の Kubernetes ダッシュボードを使用できます。

Log Analytics

Log Analytics ワークスペースのクエリダイアログで [コンテナー] カテゴリを選択して、Container Insights によって設定された ContainerImageInventory テーブルからデータを取得するイメージインベントリログクエリなどのクラスター向けの事前構築済みのログクエリにアクセスします。

トラブルシューティング

トラブルシューティングのシナリオでは、メンテナンスまたは即時ログ収集のためにノードに直接アクセスする必要がある場合があります。セキュリティのため、AKS ノードはインターネットに公開されませんが、kubectl debug コマンドを使って AKS ノードに SSH 接続できます。このプロセスの詳細については、「メンテナンスまたはトラブルシューティングのために SSH を使用して Azure Kubernetes Service (AKS) クラスターノードに接続する」を参照してください。

コスト分析

Kubernetes のコストを把握するためのオープンソースでベンダーニュートラルの CNCF サンドボックスプロジェクトである OpenCost を構成して、クラスターコストの分析をサポートします。詳細なコスト計算データを Azure Storage にエクスポートします。
OpenCost のデータを使用して、組織内のさまざまなチームによるクラスターの相対的な使用状況を内訳化し、コストをチームに割り当てることができるようにします。
OpenCost のデータを使用して、多数の小型ノードではなく、より少ない大型ノードを使用して、ワークロードを高密度にパックすることで、クラスターがそのノードの完全な容量を使用していることを確認します。

監視レベル 3 - マネージド Kubernetes コンポーネント

マネージド Kubernetes レベルには、次のコンポーネントが含まれます。

コンポーネント	監視
API サーバー	API サーバーの状態を監視し、サービスがダウンした場合の要求負荷とボトルネックの増加を特定します。
kubelet	Kubelet を監視すると、ポッド管理の問題、ポッドが起動しない、ノードの準備ができていない、ポッドが強制終了された場合のトラブルシューティングに役立ちます。

マネージド Kubernetes コンポーネントを監視するための一般的なシナリオを次に示します。

Azure Portal

メトリックスエクスプローラーを使用して、クラスターの Inflight Requests カウンターを表示します。
Kubelet ワークブックを使用して、各kubeletのヘルスとパフォーマンスを確認します。

グラファナ

Kubelet 用 Managed Grafana の事前構築済みダッシュボードを使用して、それぞれの kubelet の正常性とパフォーマンスを確認します。
API サーバーの完全なパフォーマンスを表示するには、Kubernetes API サーバーなどのダッシュボードを使用します。これには、要求の待機時間や作業キューの処理時間などの値が含まれます。

Log Analytics

リソースログを含むログクエリを使用して、AKS コンポーネントによって生成されたコントロールプレーンログを分析します。
AKS の構成アクティビティは、アクティビティログに記録されます。アクティビティログを Log Analytics ワークスペースに送信する場合は、Log Analytics を使用して分析できます。たとえば、次のサンプルクエリを使用することで、すべての AKS クラスターで正常にアップグレードされたことを示すレコードを返すことができます。
```
AzureActivity
| where CategoryValue == "Administrative"
| where OperationNameValue == "MICROSOFT.CONTAINERSERVICE/MANAGEDCLUSTERS/WRITE"
| extend properties=parse_json(Properties_d) 
| where properties.message == "Upgrade Succeeded"
| order by TimeGenerated desc
```

トラブルシューティング

トラブルシューティングのシナリオでは、「Azure Kubernetes Service (AKS) クラスターノードから kubelet ログを取得する」で説明されているプロセスを使用して、kubelet ログにアクセスできます。

監視レベル 4 - Kubernetes オブジェクトとワークロード

Kubernetes オブジェクトとワークロードレベルには、次のコンポーネントが含まれます。

コンポーネント	監視の要件
デプロイメント	デプロイの実際の状態と望ましい状態、およびデプロイで実行されているポッドの状態とリソース使用率を監視します。
ポッド	AKS クラスターで実行されているポッドの状態と、CPU とメモリを含むリソース使用率を監視します。
Containers	AKS クラスターで実行されているコンテナーの CPU とメモリを含むリソース使用率を監視します。

Kubernetes オブジェクトとワークロードを監視するための一般的なシナリオを次に示します。

Azure Portal

[ノード] ビューと [コントローラー] ビューを使って、それらで実行中のポッドの正常性とパフォーマンスを確認し、それらのコンテナーの正常性とパフォーマンスにドリルダウンします。
[コンテナー] ビューを使って、コンテナーの正常性とパフォーマンスを確認します。コンテナーの正常性とパフォーマンスの分析の詳細については、「 Container Insights を使用した Kubernetes クラスターデータの分析」を参照してください。
デプロイブックを使用して、デプロイメトリックを表示します。詳細については、「Container insights によるデプロイと HPA メトリック」を参照してください。

Grafana ダッシュボード

ノードおよびポッド 用 Managed Grafana の事前構築済みダッシュボードを使用して、正常性とパフォーマンスを表示します。
Prometheus に格納されているデータに基づいてノードのパフォーマンスと正常性を視覚化する複数の Kubernetes ダッシュボードを使用できます。

ライブデータ

トラブルシューティングのシナリオでは、コンテナーの分析情報はライブ AKS コンテナーログ (stdout または stderror)、イベント、ポッドメトリックにアクセスできます。この機能の詳細については、「Kubernetes ログ、イベント、およびポッドメトリックをリアルタイムで表示する方法」を参照してください。

プラットフォームエンジニアに対するアラート

Azure Monitor のアラートでは、監視データの興味深いデータやパターンを事前に通知します。これにより、ユーザーが気付く前に、管理者が問題を識別して対処できます。アラート用の既存の ITSM ソリューションがある場合は、Azure Monitor と統合できます。ワークスペースデータをエクスポートして、Log Analytics ワークスペースから現在のアラートソリューションをサポートする別の場所にデータを送信することもできます。

アラートの種類

次の表では、上述のサービスで収集されたデータに基づいて作成できるさまざまな種類のカスタムアラートルールについて説明します。

アラートの種類	説明
Prometheus アラート	Prometheus 警告は、Prometheus の Azure Monitor 管理サービスに格納されている Prometheus メトリックに適用される Prometheus クエリ言語 (Prom QL) で記述されます。推奨アラートには、最も一般的な Prometheus アラートが既に含まれており、必要に応じて追加のアラートルールを作成できます。
メトリックアラートルール	メトリックアラートルールでは、メトリックスエクスプローラーと同じメトリック値が使われます。実際には、現在分析しているデータを使って、メトリックスエクスプローラーから直接アラートルールを作成できます。メトリックアラートルールは、AKS データ参照メトリックのいずれかの値を使用して AKS のパフォーマンスに関するアラートを生成するのに役立ちます。
ログ検索警告ルール	ログ検索警告ルールを使用して、ログクエリの結果からアラートを生成します。詳細については、コンテナーの分析情報からログ検索アラートを作成する方法とコンテナーの分析情報からログのクエリを実行する方法に関する記事を参照してください。

推奨アラート

まず、Kubernetes クラスターの最も一般的なアラート条件を含む、Container insights のメトリックアラートルール (プレビュー) で推奨される Prometheus アラートのセットから始めます。追加のアラート条件を特定すると、後でさらにアラートルールを追加できます。

Developer

開発者は、アプリケーションの開発に加えて、クラスター上で実行されているアプリケーションを維持します。また、アプリケーションのパフォーマンスや失敗などのアプリケーション固有のトラフィックを担当し、会社で定義された SLA に従ってアプリケーションの信頼性を維持します。

監視レベル 5 - アプリケーション

Azure Monitor OpenTelemetry Distro を実装して Application Insights エクスペリエンスを有効にし、サンプリングを構成してコストを制御します。

Application Insights のエクスペリエンス

概要ダッシュボードで、アプリケーションの正常性とパフォーマンスをひとめで確認できます。
アプリケーションのアクティビティとパフォーマンスに関するリアルタイムの分析情報を得るためのライブメトリックを表示します。
障害、パフォーマンス、トランザクションを調査して、アプリケーションの正常性と効率を診断します。
アプリケーションのアーキテクチャとコンポーネントの相互作用の視覚的な概要については、アプリケーションマップを使用します。
アプリケーションの可用性を監視するための標準テストを作成します。

アプリケーションログ

Container insights は、stdout/stderr ログを Log Analytics ワークスペースに送信します。さまざまなログの説明については、リソースログを参照し、それぞれが送信される表の一覧については、Kubernetes Services を参照してください。

サービスメッシュ

AKS クラスターの場合は、マイクロサービスアーキテクチャを監視できる Istio ベースのサービスメッシュアドオンをデプロイします。 Istio は、既存の分散アプリケーションに透過的にレイヤー化するオープンソースサービスメッシュです。アドオンは、AKS 用 Istio のデプロイと管理をサポートします。

フィードバック

このページはお役に立ちましたか?

次の方法で共有

Azure Monitor とクラウド ネイティブ ツールを使用して Kubernetes クラスターを監視する

ネットワーク エンジニア

監視レベル 1 - ネットワーク

プラットフォーム エンジニア

プラットフォーム エンジニアの監視を構成する

Prometheus メトリックのスクレイピングを有効にする

Prometheus データの分析で Grafana を有効にする

コンテナー ログの収集を有効にする

AKS クラスターのコントロール プレーン ログを収集する

AKS クラスターのアクティビティ ログを収集する

モニター レベル 2 - クラスター レベルのコンポーネント

監視レベル 3 - マネージド Kubernetes コンポーネント

監視レベル 4 - Kubernetes オブジェクトとワークロード

プラットフォーム エンジニアに対するアラート

アラートの種類

推奨アラート

Developer

監視レベル 5 - アプリケーション

関連項目

フィードバック

その他のリソース

Azure Monitor とクラウドネイティブツールを使用して Kubernetes クラスターを監視する

ネットワークエンジニア

プラットフォームエンジニア

プラットフォームエンジニアの監視を構成する

コンテナーログの収集を有効にする

AKS クラスターのコントロールプレーンログを収集する

AKS クラスターのアクティビティログを収集する

モニターレベル 2 - クラスターレベルのコンポーネント

プラットフォームエンジニアに対するアラート