次の方法で共有


Azure Container Apps のワークロード プロファイル

ワークロード プロファイルは、Azure Container Apps 環境にデプロイされたコンテナー アプリで使用できるコンピューティング リソースとメモリ リソースの種類と量を決定します。 アプリケーションのさまざまなニーズに合わせて、さまざまなプロファイルを構成できます。

プロファイルの種類

Azure Container Apps では、従量課金、専用、Flex の 3 種類のワークロード プロファイルがサポートされています。

各プロファイルの種類によって、アプリのスケーリング方法、リソースの分離レベル、課金方法が決まります。

  • 従量課金プロファイル では、サーバーレス アーキテクチャが使用されます。 このプロファイル上のアプリは、オンデマンドで自動的にスケール インおよびスケールアウトし、必要に応じてアイドル時にゼロにスケーリングします。 料金は、実行中のアプリが使用するリソースに対してのみ行われます。 サーバーレス指向の課金は、特殊なワークロードのサーバーレス GPU にも適用されます。 アプリが使用するリソースに対してのみ支払うので、従量課金プロファイルは、ワークロード レベルが予測できない大量の要求やシナリオが発生するアプリに適しています。

  • 専用プロファイルは 、独自の専用プール内の予約済みコンピューティング リソースで実行されます。 仮想マシンのサイズと種類を選択し、プロファイルごとに複数のアプリをデプロイし、プロファイルインスタンスごとに支払います。 専用プロファイルは、安定したワークロードに対してコスト効率が高く、汎用、メモリ最適化、GPU のユース ケースをサポートできます。

  • Flex プロファイル (プレビュー) は、 従量課金 プロファイルの課金とセットアップのシンプルさと、専用プロファイルのパフォーマンス特性の多くを組み合わせたものです。 Flex プロファイルは、従量課金プロファイルと専用管理料金と同様に課金され、シングルテナント コンピューティング プールで実行され、計画メンテナンス期間が提供され、専用のネットワークとより大きなレプリカ サイズへのアクセスが提供されます。 Flex プロファイルには、少なくとも /25のサブネットが必要です。

各 Container Apps 環境には、既定の従量課金プロファイルが含まれています。 専用または従量課金 GPU プロファイルを追加し、使用可能な場合は、アプリケーションのニーズに合わせて Flex プロファイルを追加できます。

Flex プロファイルは現在、米国中部 EUAP、米国東部 2 EUAP、東アジア、米国中西部のリージョンでのみ使用できます。

ワークロード プロファイルのフォーム ファクター

ワークロード プロファイルの種類が異なると、汎用、メモリ最適化、GPU、ブレンドなど、さまざまな フォーム ファクター が提供されます。

プロファイルの種類 フォームファクター 説明 考えられる用途
消費 汎用 新しい環境に自動的に追加され、サーバーレス従量課金インフラストラクチャで実行されます。 特定のハードウェア要件を必要としないアプリ。
消費 GPU スケール トゥ ゼロのサーバーレス GPU は、米国西部、オーストラリア東部、スウェーデン中部などの地域で利用できます。 使用可能なリージョンの完全な一覧については、サーバーレス GPU でサポートされているリージョンを参照してください GPU アクセラレーションを必要とするアプリ。
専用 汎用 CPU リソースとメモリ リソースのバランスを取ったプロファイル。 大量の CPU またはメモリを必要とするアプリ。
専用 メモリ最適化 メモリ内データまたは機械学習モデルのメモリ リソースが増加したプロファイル。 メモリ要件が高いアプリ。
専用 GPU GPU 対応コンピューティングを使用するプロファイルは、一部のリージョンでのみ使用できます。 GPU 対応の専用プロファイルは、環境の作成時に構成する必要があります。 GPU アクセラレーションと専用ハードウェアを必要とするアプリ。

GPU 対応プロファイルを使用する場合は、アプリケーションで最新バージョンの CUDA が実行されていることを確認します。

プロファイルの詳細

次の表は、使用可能なワークロード プロファイルを プロファイルの種類別にまとめたものです。同様のサイズをグループ化して、最適なオプションを決定するのに役立ちます。 vCPU フィールドとメモリ フィールドには、プロファイル サイズ全体のリソースの範囲が表示されます。

消費プロファイルの詳細

プロファイル名 vCPU 範囲 メモリ範囲 GPU のタイプ リージョン 配賦
消費 0.25-4 0.5-8 GiB サポートされているすべてのリージョン レプリカごと
Consumption-GPU-NC24-A100、Consumption-GPU-NC8as-T4 8–24 56 ~ 220 GiB NVIDIA T4、A100 使用可能なリージョンの完全な一覧については、サーバーレス GPU でサポートされているリージョンを参照してください レプリカごと

従量課金プロファイルはすべてサーバーレス スケーリングをサポートしており、レプリカごとの使用量に基づいて課金されます。

専用プロファイルの詳細

Classification プロファイル名 vCPU 範囲 メモリ範囲 GPU のタイプ リージョン 配賦
General Purpose D4、D8、D16、D32 4–32 16 ~ 128 GiB None サポートされているすべてのリージョン ノードごと
メモリ最適化 E4、E8、E16、E32 4–32 32 ~ 256 GiB None サポートされているすべてのリージョン ノードごと
Confidential Compute DC4、DC8、DC16、DC32、DC48、DC64、DC96 4-96 16-384 GiB None UAENorth ノードごと
GPU NC24-A100、NC48-A100、NC96-A100 24–96 220 ~ 880 GiB A100 米国西部 3、北ヨーロッパ ノードごと

GPU 対応の専用プロファイルでは、ケースごとに容量が割り当てられます。 必要な容量を要求するには、サポート チケットを送信する必要があります

Flex プロファイルの詳細 (プレビュー)

プロファイル名 vCPU 範囲 メモリ範囲 リージョン 配賦
フレックス 0.25-4 0.5-16 GiB 米国中部 (EUAP)、米国東部 2 (EUAP)、東アジア、米国中西部 レプリカごと

リソースの消費とスケーリング

ワークロード プロファイル内の各アプリのメモリと CPU 使用率を制限できます。 複数のアプリで 1 つのプロファイル インスタンスを共有できるため、プロファイルのメモリ設定を調整して、すべてのアプリに十分なリソースを確保することが必要になる場合があります。

ランタイムによって一部のコンピューティング リソースが予約されるため、アプリで使用できるリソースの合計がプロファイルの割り当てよりもわずかに少なくなることに注意してください。 現在のリソースを超えて需要が増加すると、システムによってプロファイル インスタンスが自動的に追加されます。 需要が減少すると、システムはインスタンスを削除します。 最小インスタンス数と最大インスタンス数を設定することで、スケーリングを制御できます。 課金は、実行中のプロファイル インスタンスの数に基づいています。

ネットワーク

ワークロード プロファイル環境では、ユーザー定義ルートなどの追加のネットワーク機能が公開され、イングレス トラフィックとエグレス トラフィックがセキュリティで保護されます。 詳細については、 ネットワークの ドキュメントを参照してください。

次のステップ