Azure Kubernetes Service (AKS) のアーキテクチャのベストプラクティス

Azure Kubernetes Service (AKS) は、コンテナー化されたアプリケーションをデプロイして管理するために使用できるマネージド Kubernetes サービスです。他のマネージドサービスと同様に、AKS は運用上のオーバーヘッドの多くを Azure にオフロードしながら、高可用性、スケーラビリティ、移植性の機能をワークロードに提供します。

この記事では、アーキテクトとしてコンピューティングデシジョンツリーを確認し、ワークロードのコンピューティングとして AKS を選択したことを前提としています。この記事のガイダンスでは、Azure Well-Architected Framework の柱の原則にマップされたアーキテクチャに関する推奨事項を示します。

テクノロジスコープ

このレビューでは、次の Azure リソースに関する相互に関連する決定に焦点を当てます。

AKS の Well-Architected Framework の柱のベストプラクティスについて説明するときは、 クラスター と ワークロードを区別することが重要です。クラスターのベストプラクティスは、クラスター管理者とそのリソースプロバイダーの間で共有される責任ですが、ワークロードのベストプラクティスは開発者のドメインです。この記事では、これらの各ロールに関する考慮事項と推奨事項について説明します。

Note

次の柱には、設計チェックリストと、各選択がクラスター アーキテクチャ、ワークロード アーキテクチャ、またはその両方に適用されるかどうかを示す推奨事項の一覧が含まれます。

Reliability

信頼性の柱の目的は、十分な回復性を構築 し、障害から迅速に回復する機能をして継続的な機能を提供することです。

信頼性設計の原則、個々のコンポーネント、システムフロー、およびシステム全体に適用される高度な設計戦略を提供します。

ワークロード設計チェックリスト

信頼性の設計レビューチェックリストに基づいて、設計戦略を開始します。 AKS の機能とその依存関係を念頭に置いて、ビジネス要件との関連性を判断します。必要に応じて、より多くのアプローチを含むように戦略を拡張します。

(クラスター) 冗長性を構築して回復性を向上させます。 単一のリージョンにデプロイするときに可用性を向上させるために、回復性戦略の一部として AKS クラスターの可用性ゾーンを使用します。多くの Azure リージョンには、可用性ゾーンがあります。ゾーン間の接続の待機時間が短くなるほど近いですが、ローカルの停止が複数のゾーンに影響を与える可能性を減らすには十分に離れています。

重要なワークロードの場合は、異なる Azure リージョンに複数のクラスターをデプロイします。 AKS クラスターを地理的に分散することで、より高い回復性を実現し、リージョンの障害の影響を最小限に抑えることができます。マルチリージョン戦略は、可用性を最大化し、ビジネス継続性を提供するのに役立ちます。インターネットに接続するワークロードでは、 Azure Front Door または Azure Traffic Manager を使用して、AKS クラスター間でトラフィックをグローバルにルーティングする必要があります。詳細については、「マルチリージョン戦略」を参照してください。

クラスターが複数クラスタートポロジのフェールオーバートラフィックを確実にスケーリングして処理できるように、IP アドレス空間を計画します。
(クラスターとワークロード) クラスターとワークロードの信頼性と全体的な正常性インジケーターを監視します。 ログとメトリックを収集してワークロードの正常性を監視し、パフォーマンスと信頼性の傾向を特定し、問題のトラブルシューティングを行います。 Azure Monitor を使用して Kubernetes を監視するためのベストプラクティスと、ワークロード用の Well-Architected Health モデリングガイドを確認して、AKS ソリューションの信頼性と正常性監視ソリューションの設計に役立ててください。

水平スケーリングをサポートし、アプリケーションの準備と正常性をレポートするようにワークロードが構築されていることを確認します。
(クラスターとワークロード) ユーザーノードプールでアプリケーションポッドをホストします。 システムポッドをアプリケーションワークロードから分離することで、AKS の重要なサービスが、リソースの需要や、ユーザーノードプールを実行するワークロードによって引き起こされる潜在的な問題の影響を受けないようにすることができます。

ワークロードがユーザーノードプールで実行されていることを確認し、適切なサイズの SKU を選択します。少なくとも、ユーザーノードプール用に 2 つのノード、システムノードプール用に 3 つのノードを含めます。
(クラスターとワークロード) 可用性と復旧のターゲットに AKS アップタイムサービスレベルアグリーメント (SLA) を考慮します。 クラスターとワークロードの信頼性と復旧のターゲットを定義するには、「信頼性ターゲットを定義するための推奨事項」のガイダンスに従ってください。その後、それらの目標を満たす設計を作成します。
(クラスターとワークロード)Azure Backup を使用して AKS クラスターサービスを保護するには、バックアップコンテナーに復旧ポイントを格納し、障害シナリオの間に復元を実行します。 AKS クラスターで実行されているコンテナー化されたアプリケーションとデータをバックアップおよび復元するには、保護を構成するための AKS バックアップの概要のガイダンスに従います。

構成に関する推奨事項

Recommendation	Benefit
(クラスターとワークロード)ノードセレクターとアフィニティを使用してポッドのスケジュールを制御します。 AKS では、Kubernetes スケジューラはノード内のハードウェアによってワークロードを論理的に分離できます。容認とは異なり、一致するノードセレクターがないポッドはラベル付けされたノードでスケジュールできますが、一致するノードセレクターを定義するポッドに優先順位が与えられます。	ノードアフィニティにより柔軟性が高まるため、ポッドをノードと一致できない場合の動作を定義できます。
(クラスター)ネットワーク要件とクラスターのサイズ設定に基づいて、適切なネットワークプラグインを選択します。ネットワークプラグインによって、さまざまなレベルの機能が提供されます。 Azure Container Networking Interface (Azure CNI) は、Windows ベースのノードプール、一部のネットワーク要件、Kubernetes ネットワークポリシーなどの特定のシナリオに必要です。 IP アドレス管理を強化する場合は、ファイアウォール規則やネットワークポリシーとのネットワークセキュリティ統合を維持しながら、ネットワーク計画を改善し、IP アドレスの枯渇を軽減する静的ブロック割り当てによる Azure CNI を検討してください。詳細については、 Kubenet と Azure CNI の比較に関するページを参照してください。	適切なネットワークプラグインは、互換性とパフォーマンスの向上に役立ちます。静的ブロックの割り当てにより、セキュリティポリシーの構成と容量計画を向上させるために一貫した IP 範囲が有効になります。
(クラスターとワークロード)運用グレードのクラスターには、AKS アップタイム SLA を使用します。	ワークロードでは、AKS クラスターの Kubernetes API サーバーエンドポイントの可用性の保証が高いため、高可用性ターゲットをサポートできます。
(クラスター) 可用性ゾーンを使用して、物理的に分離されたデータセンターに AKS エージェントノードを分散することで、Azure リージョン内の回復性を最大化します。併置要件が存在する場合は、通常の仮想マシンスケールセットベースの AKS デプロイを 1 つのゾーンに使用するか、近接配置グループを使用してノード間の待機時間を最小限に抑えます。	ノードプールを複数のゾーンに分散することで、1 つのノードプール内のノードは、別のゾーンがダウンした場合でも引き続き実行されます。
(クラスターとワークロード)アプリケーション配置マニフェストでポッドリソースの要求と制限を定義します。 Azure Policy を使用して、これらの制限を適用します。	Kubernetes クラスターでのリソースの枯渇を防ぐには、コンテナーの CPU とメモリのリソース制限が必要です。
(クラスターとワークロード)システムノードプールをアプリケーションワークロードから分離したままにします。システムノードプールには、少なくとも 2 つの vCPU と 4 GB のメモリの仮想マシン (VM) SKU が必要です。 4 vCPU 以上を使用することをお勧めします。詳しくは、システム・ノード・プールおよびユーザー・ノード・プールを参照してください。	システムノードプールは、クラスターのコントロールプレーンに不可欠な重要なシステムポッドをホストします。これらのシステムポッドをアプリケーションワークロードから分離することで、重要なサービスがリソースの需要やワークロードによって引き起こされる潜在的な問題の影響を受けないようにすることができます。
(クラスターとワークロード)特定の要件に基づいてアプリケーションを専用ノードプールに分離し、そのセグメント化について意図的に行います。管理オーバーヘッドを減らすために、多数のノードプールを避けてください。たとえば、同じ要件を満たしている限り、複数の Virtual Machines SKU を 1 つのノードプールに併置できます。	アプリケーションは同じ構成を共有でき、GPU 対応 VM、CPU またはメモリ最適化 VM、またはゼロにスケーリングする機能が必要です。ノードプールを特定のアプリケーションに専用化することで、リソースを過剰にプロビジョニングまたは過小使用することなく、各アプリケーションが必要なリソースを確実に取得できます。
(クラスター)多数の同時送信接続を行うワークロードを実行するクラスターには、NAT ゲートウェイを使用します。	Azure NAT Gateway は、大規模な信頼性の高いエグレストラフィックをサポートし、高い同時送信トラフィックに Azure Load Balancer の制限を適用することで信頼性の問題を回避するのに役立ちます。
(クラスターとワークロード)Azure Backup を使用して AKS クラスターを保護し、障害発生時に別のリージョンに復元します。 Azure Backup では、コンテナー化されたアプリケーションのバックアップ操作と復元操作と、クラスターの状態とアプリケーションデータの両方で実行されるデータがサポートされます。リージョンの障害シナリオでバックアップを使用し、バックアップを復旧できます。	Azure Kubernetes Service (AKS) を使用した Azure Backup は、フルマネージドのスケーラブルでセキュリティで保護されたコスト効率の高いソリューションを提供します。バックアップインフラストラクチャの設定と保守の複雑さなしで、ワークロードの信頼性を向上させます。

セキュリティ

セキュリティの柱の目的は、ワークロードに対して機密性、整合性、可用性を保証することです。

セキュリティ設計の原則は、AKS の技術設計にアプローチを適用することで、これらの目標を達成するための高度な設計戦略を提供します。

ワークロード設計チェックリスト

セキュリティの設計レビューチェックリストに基づいて設計戦略を開始し、セキュリティ体制を改善するための脆弱性と制御を特定します。 AKS セキュリティの概念を理解し、CIS Kubernetes ベンチマークに基づいてセキュリティ強化の推奨事項を評価します。必要に応じて、より多くのアプローチを含むように戦略を拡張します。

(クラスター)ID とアクセス管理のために Microsoft Entra ID と統合します。Microsoft Entra ID を使用してクラスターの ID 管理を一元化します。ユーザーアカウントまたはグループの状態が変わると、AKS クラスターにアクセスしたとき、その変更内容が自動的に更新されます。プライマリセキュリティ境界として ID を確立します。お使いの Kubernetes クラスターの開発者とアプリケーション所有者はさまざまなリソースへのアクセスを必要とします。

最小限の特権アクセスには、Microsoft Entra ID で Kubernetes ロールベースのアクセス制御 (RBAC) を使用します。管理者特権の割り当てを最小限に抑えることで、構成とシークレットを保護します。
(クラスター)セキュリティ監視およびセキュリティ情報およびイベント管理ツールと統合します。Microsoft Sentinel で Microsoft Defender for Containers を使用して、クラスターとその上で実行されるワークロード全体の脅威を検出して迅速に対応します。 Microsoft Sentinel の AKS コネクタを有効にして、AKS 診断ログを Microsoft Sentinel にストリーミングします。
(クラスターとワークロード) セグメント化とネットワーク制御を実装します。 データ流出を防ぐには、承認された安全なトラフィックのみが許可され、セキュリティ侵害の爆発半径が含まれていることを確認します。

プライベート AKS クラスターを使用して、API サーバーへのクラスター管理トラフィックがプライベートネットワーク上に残っていることを確認することを検討してください。または、パブリッククラスターに対して API サーバーの許可リストを使用します。
(ワークロード) Web アプリケーションファイアウォール (WAF) を使用して、潜在的な攻撃の受信トラフィックをスキャンします。 WAF は、アプリケーションに到達する前に悪意のあるトラフィックをブロックするのに役立つ脅威をリアルタイムで検出して軽減できます。 SQL インジェクション、クロスサイトスクリプティング、その他の Open Web アプリケーションセキュリティプロジェクトの脆弱性など、一般的な Web ベースの攻撃に対する堅牢な保護を提供します。 Azure Application Gateway や Azure Front Door などの一部のロードバランサーには、統合された WAF があります。
(ワークロード) 強化されたワークロードのソフトウェアサプライチェーンを維持します。 コンテナー対応のスキャンを使用して、継続的インテグレーションと継続的デリバリーパイプラインが強化されていることを確認します。
(クラスターとワークロード) 特殊なセキュリティで保護されたワークロードに対して追加の保護を実装します。 クラスターで機密性の高いワークロードを実行する必要がある場合は、プライベートクラスターのデプロイが必要になる場合があります。いくつかの例を次に示します。
- Payment Card Industry Data Security Standard (PCI-DSS 3.2.1): PCI-DSS 3.2.1 用の AKS 規制クラスター
- AKS での DoD 影響レベル 5 (IL5) のサポートと要件: Azure Government IL5 の分離要件。
(クラスター)コントロールプレーンで管理されているクラスター拡張機能のセキュリティ強化を活用します。拡張機能マネージャーは Azure で管理されるコントロールプレーンで実行され、ワーカーノードの攻撃対象領域を減らし、拡張機能の機能を維持しながらクラスターのネットワーク要件を簡素化します。この一元化された拡張機能管理により、顧客のワーカーノードで拡張機能コンポーネントをセキュリティで保護して維持する必要がなくなります。

構成に関する推奨事項

Recommendation	Benefit
(クラスター)クラスターでマネージド ID を使用します。	サービスプリンシパルの管理とローテーションに関連するオーバーヘッドを回避できます。
(ワークロード) AKS で Microsoft Entra ワークロード ID を使用して、Azure Key Vault や Microsoft Graph などの Microsoft Entra で保護されたリソースにワークロードからアクセスします。	AKS ワークロード ID を使用して、コード内で資格情報を直接管理しなくても、Microsoft Entra ID RBAC を使用して Azure リソースへのアクセスを保護します。
(クラスター) AKS から Azure Container Registry で認証するには、Microsoft Entra ID を使用します。	Microsoft Entra ID を使用すると、AKS は、 `imagePullSecrets` シークレットを使用せずに Container Registry で認証できます。
(クラスター)ワークロード要件により高いレベルのセグメント化が必要な場合は、プライベート AKS クラスターを使用して API サーバーへのネットワークトラフィックをセキュリティで保護します。	既定では、ノードプールと API サーバー間のネットワークトラフィックは、Microsoft バックボーンネットワークを移動します。プライベートクラスターを使用すると、API サーバーへのネットワークトラフィックがプライベートネットワークのみに残ることを確認できます。
(クラスター)パブリック AKS クラスターの場合は、API サーバーによって承認された IP アドレス範囲を使用します。デプロイビルドエージェントのパブリック IP アドレス、操作管理、ノードプールのエグレスポイント (Azure Firewall など) などのソースを含めます。	パブリッククラスターを使用する場合、クラスターの API サーバーに到達できるトラフィックを制限することで、AKS クラスターの攻撃対象領域を大幅に削減できます。
(クラスター)Microsoft Entra ID RBAC を使用して API サーバーを保護します。 Microsoft Entra ID ベースの ID を使用してすべてのクラスターアクセスを適用するには、ローカルアカウントを無効にします。	Kubernetes API サーバーへのアクセスのセキュリティ保護は、クラスターをセキュリティで保護するために実行できる最も重要なことの 1 つです。 Kubernetes RBAC を Microsoft Entra ID と統合して、API サーバーへのアクセスを制御します。
(クラスター) Azure ネットワークポリシーまたは Calico を使用します。	ポリシーを使用すると、クラスター内のポッド間のネットワークトラフィックをセキュリティで保護および制御できます。 Calico は、ポリシーの順序付けと優先順位、拒否規則、より柔軟な一致ルールなど、より豊富な機能セットを提供します。
(クラスター) Azure Policy を使用してクラスターとポッドをセキュリティで保護する。	Azure Policy は、一元化された一貫性のある方法でクラスターに大規模な適用と保護を適用するのに役立ちます。また、ポッドに付与される関数を制御し、会社のポリシーに対して何かが実行されているかどうかを検出することもできます。
(クラスター)リソースへのコンテナーアクセスをセキュリティで保護します。コンテナーで実行できるアクションへのアクセスを制限します。最小限のアクセス許可を付与し、ルートまたは特権エスカレーションの使用を避けます。 Linux ベースのコンテナーについては、組み込みの Linux セキュリティ機能を使用したリソースへのセキュリティコンテナーのアクセスに関する記事を参照してください。	アクセス許可を制限し、ルートまたは特権エスカレーションの使用を回避することで、セキュリティ侵害のリスクを軽減できます。コンテナーが侵害された場合でも、潜在的な損害が最小限に抑えられるよう支援できます。
(クラスター)クラスターの送信トラフィックが Azure Firewall や HTTP プロキシなどのネットワークセキュリティポイントを通過するようにして、クラスターエグレストラフィックを制御します。	Azure Firewall または HTTP プロキシを介して送信トラフィックをルーティングすることで、未承認のアクセスとデータ流出を防ぐセキュリティポリシーを適用できます。この方法では、セキュリティポリシーの管理も簡素化され、AKS クラスター全体で一貫性のある規則を適用しやすくなります。
(クラスター)プロキシに依存する環境の既存の AKS クラスターに対して HTTP プロキシのサポートを構成します。 AKS ノードとポッドの両方の HTTP プロキシ構成を有効にして、既存のエンタープライズネットワークセキュリティアーキテクチャとコンプライアンス要件と統合します。	セキュリティスキャンとコンプライアンスの監視のために、すべてのインターネットトラフィックを企業の HTTP プロキシ経由で流す必要がある金融サービスやその他の規制対象業界にとって重要です。既存のエンタープライズネットワークセキュリティインフラストラクチャとのシームレスな統合を実現します。
(クラスター)カスタム証明機関のサポートを実装して、AKS クラスターとエンタープライズ PKI インフラストラクチャ間の信頼関係を確立します。カスタム CA を構成して、既存の組織の証明書管理フレームワーク内のプライベートレジストリ、プロキシ、ファイアウォールの信頼を有効にします。	内部証明機関インフラストラクチャを持つ企業に不可欠です。 AKS クラスターで、企業のセキュリティポリシーとコンプライアンス要件を維持しながら、組織のプライベートレジストリと内部サービスを信頼できるようにします。
(クラスター)Key Vault でオープンソースの Microsoft Entra ワークロード ID とシークレットストア CSI ドライバーを使用します。	これらの機能は、強力な暗号化を使用して Key Vault のシークレット、証明書、接続文字列を保護およびローテーションするのに役立ちます。アクセス監査ログを提供し、コアシークレットをデプロイパイプラインから除外します。
(クラスター) Microsoft Defender for Containers を使用します。	Microsoft Defender for Containers は、クラスター、コンテナー、およびアプリケーションのセキュリティを監視および維持するのに役立ちます。

コストの最適化

コストの最適化では、支出パターンの検出 、重要な領域への投資の優先順位付け、ビジネス要件を満たしながら組織の予算を満たすために他の での最適化に重点を置いています。

コスト最適化設計原則は、これらの目標を達成し、AKS とその環境に関連する技術設計で必要に応じてトレードオフを行う高度な設計戦略を提供します。

ワークロード設計チェックリスト

投資のコスト最適化の設計レビューチェックリストに基づいて、設計戦略を開始します。ワークロードの設計を、そのワークロードに割り当てられた予算に合わせて微調整します。設計では、適切な Azure 機能を使用し、投資を監視し、時間の経過と同時に最適化する機会を見つける必要があります。

(クラスター) コストモデルに AKS の価格レベルを含めます。 コストを見積もるために、 Azure 料金計算ツールを使用し、計算ツールでさまざまな構成と支払いプランをテストします。
(クラスター) ワークロードに最適な料金を取得します。 ワークロードの実行コストに直接影響するため、ノードプールごとに適切な VM SKU を使用します。適切な使用率なしで高パフォーマンスの VM を選択すると、無駄な支出につながる可能性があります。あまり強力でない VM を選択すると、パフォーマンスの問題が発生し、ダウンタイムが増加する可能性があります。

容量を適切に計画していて、ワークロードが予測可能で、長期間存在する場合は、 Azure の予約または節約計画にサインアップして、リソースコストを削減します。

Azure Spot Virtual Machines を選択して、使用率の低い Azure 容量を大幅な割引で使用します。これらの割引は、従量課金制の価格の最大 90% に達する場合があります。容量が Azure で再び必要になると、Azure インフラストラクチャはスポットノードを削除します。

オンプレミスまたはエッジで AKS を実行する場合は、 Azure ハイブリッド特典を使用して、これらのシナリオでコンテナー化されたアプリケーションを実行するときのコストを削減することもできます。
(クラスターとワークロード) ワークロードコンポーネントのコストを最適化します。 ワークロードに最もコスト効率の高いリージョンを選択します。コスト、待機時間、コンプライアンスの要件を評価して、ワークロードをコスト効率の高い方法で実行し、顧客に影響を与えたり、追加のネットワーク料金を作成したりしないようにします。 Azure にワークロードをデプロイするリージョンは、コストに大きな影響を与える可能性があります。多くの要因により、リソースのコストは Azure のリージョンごとに異なります。

新しいノードではそれらのイメージをダウンロードする必要があるため、コストを削減するために、小さく最適化されたイメージを維持します。アプリケーションの起動時にユーザー要求のエラーまたはタイムアウトが発生すると、オーバープロビジョニングが発生する可能性があります。障害やタイムアウトを回避するために、コンテナーをできるだけ早く起動できるようにイメージをビルドします。

Azure Monitor で Kubernetes を監視するためのベストプラクティスのコスト最適化に関する推奨事項を確認して、ワークロードに最適な監視戦略を決定します。 CPU、メモリ、ストレージ、ネットワークから始まるパフォーマンスメトリックを分析して、クラスター、ノード、名前空間ごとにコスト最適化の機会を特定します。
(クラスターとワークロード) ワークロードのスケーリングコストを最適化します。 すべてのワークロード要件を満たしながら、スケーリングコストを削減するために、垂直方向と水平方向の別のスケーリング構成を検討してください。ワークロードのアクティブが低い場合は、自動スケーラーを使用してスケールインします。
(クラスターとワークロード) コストデータを収集して分析します。 コストの最適化を有効にする基礎は、コスト削減クラスターの分散です。コスト削減目標の調整を推進し、クラウドコストに透明性をもたらすために、財務チーム、運用チーム、エンジニアリングチーム間のコラボレーションを含むコスト効率の考え方を開発します。

構成に関する推奨事項

Recommendation	Benefit
(クラスターとワークロード) AKS SKU の選択とマネージドディスクサイズをワークロードの要件に合わせます。	選択内容をワークロードの需要に合わせることは、不要なリソースに対して支払いを行わないようにするのに役立ちます。
(クラスター) AKS ノードプールに適した VM インスタンスの種類を選択します。適切な VM インスタンスの種類を決定するには、ワークロードの特性、リソース要件、および可用性のニーズを考慮してください。	適切な VM インスタンスの種類を選択することは、AKS でアプリケーションを実行するコストに直接影響するため、非常に重要です。適切な使用率なしで高パフォーマンスのインスタンスを選択すると、無駄な支出につながる可能性があります。あまり強力でないインスタンスを選択すると、パフォーマンスの問題やダウンタイムの増加につながる可能性があります。
(クラスター)より電力効率の高い Azure Resource Manager アーキテクチャに基づいて VM を選択します。 AKS では、 Arm64 ノードプールの作成と、クラスター内での Intel と Resource Manager のアーキテクチャノードの組み合わせがサポートされています。	Arm64 アーキテクチャでは、電力使用率が低く、コンピューティングパフォーマンスが効率的であるため、価格とパフォーマンスの比率が向上します。これらの機能により、低コストでより優れたパフォーマンスが得られます。
(クラスター) クラスターオートスケーラーを有効にして、過剰なリソース容量に応じてエージェントノードの数を自動的に減らします。	AKS クラスター内のノード数を自動的にスケールダウンすると、需要が少ないときに効率的なクラスターを実行し、需要が増加したときにスケールアップできます。
(クラスター) ノードの自動プロビジョニングを有効にして、VM SKU の選択を自動化します。	ノードの自動プロビジョニングにより、SKU の選択プロセスが簡素化され、保留中のポッドリソース要件に基づいて、最も効率的でコスト効率の高い方法でワークロードを実行するための最適な VM 構成が決定されます。
(ワークロード) HorizontalPodAutoscaler を使用して、CPU 使用率やその他のメトリックに応じてデプロイ内のポッドの数を調整します。	需要が少ない場合はポッドの数を自動的にスケールダウンし、需要が増加したときにスケールアウトすると、ワークロードの運用コスト効率が向上します。
(ワークロード) VerticalPodAutoscaler (プレビュー) を使用してポッドを適切にサイズ変更し、過去の使用状況に基づいて要求と制限を動的に設定します。	各ワークロードのコンテナーにリソース要求と制限を設定することで、VerticalPodAutoscaler は他のポッドの CPU とメモリを解放し、AKS クラスターの効果的な使用率を確保するのに役立ちます。
(クラスター) AKS コスト分析アドオンを構成します。	コスト分析クラスター拡張機能を使用すると、クラスターまたは名前空間内のさまざまな Kubernetes リソースに関連付けられているコストに関する詳細な分析情報を取得できます。

オペレーショナルエクセレンス

オペレーショナルエクセレンスは主に、開発プラクティス、可観測性、リリース管理の手順に重点を置いています。

オペレーショナルエクセレンス設計原則、ワークロードの運用要件に対してこれらの目標を達成するための高度な設計戦略を提供します。

ワークロード設計チェックリスト

監視、テスト、デプロイのプロセスを定義するためのオペレーショナルエクセレンスの設計レビューチェックリストに基づいて、設計戦略を開始します。理解して実装するための主な考慮事項については、 AKS のベストプラクティスと Day-2 操作ガイドを参照してください。

(クラスター) コードとしてのインフラストラクチャ (IaC) デプロイアプローチを実装します。 Bicep、Terraform、または同様のツールを使用して、宣言型のテンプレートベースのデプロイアプローチを使用します。すべてのデプロイが反復可能でトレース可能であり、ソースコードのリポジトリに保存されている必要があります。詳細については、AKS 製品ドキュメントのクイックスタートを参照してください。
(クラスターとワークロード) インフラストラクチャとワークロードのデプロイを自動化します。 標準的なソフトウェアソリューションを使用して、クラスターとワークロードのデプロイを管理、統合、自動化します。デプロイパイプラインをソース管理システムと統合し、自動テストを組み込みます。

必要なクラスター全体の構成とデプロイでクラスターがブートストラップされるように、自動化されたプロセスを構築します。通常、このプロセスは GitOps を使用して実行されます。

ソフトウェア開発ライフサイクル内で、ワークロードに対して反復可能で自動化されたデプロイプロセスを使用します。
(クラスターとワークロード) 包括的な監視戦略を実装します。 ログとメトリックを収集してワークロードの正常性を監視し、パフォーマンスと信頼性の傾向を特定し、問題のトラブルシューティングを行います。 Azure Monitor を使用して Kubernetes を監視するためのベストプラクティスと、監視システムを設計および作成するための Well-Architected 推奨事項を確認して、ワークロードに最適な監視戦略を決定します。

診断設定を有効にして、コントロールプレーンまたはコア API サーバーの対話がログに記録されるようにします。

ワークロードは、収集可能なテレメトリを出力するよう設計する必要があり、それにはライブネス状態と準備完了状態も含める必要があります。
(クラスターとワークロード) 運用戦略でテストを実装する。 運用環境でのテストでは、実際のデプロイを使用して、運用環境でのアプリケーションの動作とパフォーマンスを検証および測定します。 Kubernetes を対象とするカオスエンジニアリングプラクティスを使用して、アプリケーションまたはプラットフォームの信頼性の問題を特定します。

Azure Chaos Studio は、障害をシミュレートし、ディザスターリカバリーの状況をトリガーするのに役立ちます。
(クラスターとワークロード) ワークロードガバナンスを適用する。 Azure Policy は、組織の標準に一貫したコンプライアンスを確保し、ポリシーの適用を自動化し、クラスターリソースの一元的な可視性と制御を提供します。

AKS で使用可能な組み込みポリシーの詳細については、「 Azure ポリシー」セクションを参照してください。
(クラスターとワークロード) ミッションクリティカルなワークロードには、スタンプレベルのブルーグリーンデプロイを使用します。 スタンプレベルの青緑色のデプロイアプローチでは、変更のリリースに対する信頼性が高くなり、ダウンタイムなしのアップグレードが可能になります。これは、Azure プラットフォーム、リソースプロバイダー、IaC モジュールなどのダウンストリーム依存関係との互換性を検証できるためです。

Kubernetes とイングレスコントローラーは、リリースエンジニアリングプロセスに組み込むための多くの高度なデプロイパターンをサポートしています。ブルー/グリーンデプロイやカナリアリリースなどのパターンを検討してください。
(クラスターとワークロード) ワークロードをより持続可能なものにします。 ワークロードの持続性とクラウド効率を高めるためには、 コストの最適化、 炭素排出量の削減、 エネルギー消費の最適化に関する取り組みを組み合わせる必要があります。アプリケーションのコストを最適化することは、ワークロードをより持続可能にするための第一歩です。

持続可能で効率的な AKS ワークロードを構築する方法については、 AKS の持続可能なソフトウェアエンジニアリングの原則を参照してください。

構成に関する推奨事項

Recommendation	Benefit
(クラスター) AKS 用の Azure ポリシーを使用して、クラスターとポッドの構成標準を運用化します。	AKS 用の Azure ポリシーは、一元化された一貫性のある方法でクラスターに大規模な適用と保護を適用するのに役立ちます。ポリシーを使用して、ポッドに付与されるアクセス許可を定義し、会社のポリシーに確実に準拠します。
(クラスター)予測可能なポッドサブネット割り当て用に Azure CNI 静的ブロック割り当てを構成し、AKS クラスターでの IP アドレス管理を強化します。定義されたサブネット範囲内の Kubernetes ポッドに予測可能な IP アドレス割り当てを提供する静的ブロック割り当てを実装し、既存のネットワークセキュリティポリシーとの統合を有効にします。	既存のネットワークセキュリティポリシーやファイアウォール規則と統合するために、予測可能な IP アドレスの割り当てを必要とする複数の AKS クラスターを実行する開発チームにとって不可欠です。予測可能なネットワークアドレス指定と簡素化された IP 管理により、オペレーショナルエクセレンスを強化します。
(ワークロード) Kubernetes イベントドリブンオートスケーラー (KEDA) を使用します。	KEDA を使用すると、処理されるイベントの数など、イベントに基づいてアプリケーションをスケーリングできます。 50 を超える KEDA スケーラーの豊富なカタログから選択できます。
(クラスター) KAITO AI Toolchain Operator を使用して、ワークロードにサービスを提供する AI モデルの効率的なデプロイと管理を行います。	KAITO は、Kubernetes での AI モデルのデプロイとスケーリングを簡素化すると同時に、機械学習推論ワークロード用に最適化されたインフラストラクチャを提供します。データサイエンスチームは、手動の Kubernetes 構成を使用せずに GPU リソース、モデルサービスインフラストラクチャ、スケーリングポリシーを自動的に処理する KAITO を使用して、AKS に大規模な言語モデルやその他の AI モデルをデプロイしてスケーリングし、運用の複雑さを軽減できます。
(クラスター)自動クラスター管理を使用して、フルマネージド Kubernetes エクスペリエンスに対して AKS Automatic を有効にします。	AKS Automatic は、最適な構成とセキュリティ体制を確保しながら、ルーチンタスクを自動化することで、Kubernetes クラスター管理の運用オーバーヘッドを削減します。開発チームは、クラスターの構成、更新、最適化を管理せずに AKS にアプリケーションをデプロイできます。これにより、Kubernetes インフラストラクチャがベストプラクティスに自動的に従うことを保証しながら、アプリケーション開発に集中できます。

パフォーマンス効率

パフォーマンス効率とは、容量の管理により、負荷が増加してもユーザーエクスペリエンスを維持することです。この戦略には、リソースのスケーリング、潜在的なボトルネックの特定と最適化、ピークパフォーマンスの最適化が含まれます。

パフォーマンス効率設計の原則、予想される使用に対してこれらの容量目標を達成するための高度な設計戦略を提供します。

ワークロード設計チェックリスト

AKS の主要業績評価指標に基づいてベースラインを定義するためのパフォーマンス効率の設計レビューチェックリストに基づいて、設計戦略を開始します。

(クラスターとワークロード) 容量計画を実施する。 SKU、自動スケール設定、IP アドレス指定、フェールオーバーに関する考慮事項を含む詳細な容量計画の演習を実行して反復処理します。

容量プランを正式に作成した後、クラスターのリソース使用率を継続的に監視することで、プランを頻繁に更新します。
(クラスター) スケーリング戦略を定義します。 リソースが過剰使用や無駄なくワークロードの需要を満たすように効率的に調整されるようにスケーリングを構成します。クラスターの自動スケーリングや HorizontalPodAutoscaler などの AKS 機能を使用して、ワークロードのニーズを動的に満たし、運用に対する負担を軽減します。ワークロードを最適化して、コンテナー内で効率的に運用およびデプロイします。

スケーリングとパーティション分割のガイドを確認して、スケーリング構成のさまざまな側面を理解します。
(クラスターとワークロード) パフォーマンステストを実施する。 ポッドとクラスターオートスケーラーの両方を実行する継続的なロードテストアクティビティを実行します。パフォーマンス目標と確立されたベースラインと結果を比較します。
(クラスターとワークロード) ワークロードとフローを個別にスケーリングします。 ワークロードを分離し、異なるノードプールに流れ込んで、独立したスケーリングを可能にします。フローを使用したワークロード設計の最適化に関する記事のガイダンスに従って、フローを特定し、優先順位を付けます。

構成に関する推奨事項

Recommendation	Benefit
(クラスター) クラスターオートスケーラーを有効にして、ワークロードの需要に応じてエージェントノードの数を自動的に調整します。 HorizontalPodAutoscaler を使用して、CPU 使用率やその他のメトリックに応じてデプロイ内のポッドの数を調整します。	ノードの数と AKS クラスター内のポッドの数を自動的にスケールアップまたはスケールダウンする機能により、効率的でコスト効率の高いクラスターを実行できます。
(クラスターとワークロード)ワークロードを異なるノードプールに分割し、ユーザーノードプールのスケーリングを検討します。	常に実行中のノードが必要なシステムノードプールとは異なり、ユーザーノードプールを使用すると、スケールアップまたはスケールダウンできます。
(ワークロード)AKS の高度なスケジューラ機能を使用して、それらを必要とするワークロードのリソースの高度な分散を実装します。	AKS クラスターを管理するときは、多くの場合、チームとワークロードを分離する必要があります。 Kubernetes スケジューラが提供する高度な機能を使用すると、特定のノードでスケジュールできるポッドを制御できます。また、マルチポッドアプリケーションをクラスター全体に適切に分散する方法を制御することもできます。
(ワークロード) KEDA を使用して、ワークロードに固有のシグナルに基づいて意味のある自動スケールルールセットを構築します。	すべてのスケールの決定を CPU またはメモリのメトリックから導き出せるわけではありません。スケーリングに関する考慮事項は、多くの場合、より複雑なデータポイントや外部データポイントから生まれます。 KEDA を使用すると、キュー内のメッセージの数やトピックのラグの長さなど、イベントに基づいてアプリケーションをスケーリングできます。
(クラスター)数百のノードを含む大規模な Kubernetes デプロイで Container Insights に対して Azure Monitor の高スケールモードを有効にします。ハイスケールモードでは、監視のパフォーマンスが最適化され、包括的な可観測性を維持しながらリソースの消費量が削減されます。	高スケールモードでは、エージェントリソースのオーバーヘッドを減らし、データ収集のパフォーマンスを向上させることで、大規模な Kubernetes デプロイを効率的に監視できます。この最適化は、標準の監視アプローチがクラスターのパフォーマンスに影響を与え、コストを増加させる可能性がある数百のノードを実行するエンタープライズ環境に不可欠です。

Azure ポリシー

Azure には、一般的な Azure ポリシーや Kubernetes 用の Azure Policy アドオン、クラスター内など、Azure リソースに適用される AKS に関連する広範な組み込みポリシーセットが用意されています。 Azure リソースポリシーの多くは、 Audit/Deny と Deploy If Not Exists バリアントの 両方に含まれています。組み込みの Azure Policy 定義に加えて、AKS リソースと Kubernetes 用の Azure Policy アドオンの両方にカスタムポリシーを作成できます。

この記事の推奨事項の一部は、Azure Policy を使用して監査できます。たとえば、次のクラスターポリシーを確認できます。

クラスターには、ポッドの仕様に合わせて対応性またはライブネスの正常性プローブが構成されています。
クラウドベースのポリシー用の Microsoft Defender。
認証モードと構成ポリシー (Microsoft Entra ID、RBAC など)、ローカル認証を無効にします。
プライベートクラスターを含む API サーバーネットワークアクセスポリシー。
GitOps 構成ポリシー。
診断設定ポリシー。
AKS バージョンの制限。
コマンド呼び出しを禁止します。

次のクラスターとワークロードポリシーを確認することもできます。

Linux ベースのワークロードに対する Kubernetes クラスターポッドのセキュリティイニシアチブ。
AppArmor、sysctl、セキュリティキャップ、SELinux、seccomp、特権コンテナー、自動マウントクラスター API 資格情報などのポッドとコンテナーの機能ポリシーを含めます。
マウント、ボリュームドライバー、およびファイルシステムポリシー。
ホストネットワーク、ポート、許可された外部 IP、HTTP、内部ロードバランサーなど、ポッドとコンテナーのネットワークポリシー。
名前空間のデプロイの制限。
CPU とメモリのリソース制限。

包括的なガバナンスについては、 Kubernetes の Azure Policy 組み込み定義と、コンピューティングレイヤーのセキュリティに影響する可能性があるその他のポリシーを確認します。

Azure Advisor の推奨事項

Azure Advisor は、Azure デプロイを最適化するためのベストプラクティスに従うのに役立つ、パーソナライズされたクラウドコンサルタントです。

詳細については、 Azure Advisor に関するページを参照してください。

アーキテクチャの例

主要な推奨事項を示す基本的なアーキテクチャ: AKS ベースラインアーキテクチャ。

この記事で強調表示されている推奨事項を示すリソースとして、次の記事を検討してください。

次の製品ドキュメントを使用して、実装の専門知識を構築します。

AKS 製品ドキュメント

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-10-13

次の方法で共有

Azure Kubernetes Service (AKS) のアーキテクチャのベスト プラクティス

Reliability

ワークロード設計チェックリスト

構成に関する推奨事項

セキュリティ

ワークロード設計チェックリスト

構成に関する推奨事項

コストの最適化

ワークロード設計チェックリスト

構成に関する推奨事項

オペレーショナル エクセレンス

ワークロード設計チェックリスト

構成に関する推奨事項

パフォーマンス効率

ワークロード設計チェックリスト

構成に関する推奨事項

Azure ポリシー

Azure Advisor の推奨事項

アーキテクチャの例

関連コンテンツ

フィードバック

その他のリソース

Azure Kubernetes Service (AKS) のアーキテクチャのベストプラクティス

オペレーショナルエクセレンス