Azure AI Foundry では、Azure AI Foundry Services (旧称 Azure AI Services) のモデル デプロイの概念を使用してモデルを使用できるようになります。 モデル デプロイは Azure リソースでもあります。また、作成時には、特定の構成で特定のモデルへのアクセス権を付与します。 このような構成には、要求を処理するために必要なインフラストラクチャが含まれます。
Azure AI Foundry モデルは、ビジネスパターンと使用パターンに合ったホスティング構造の選択肢を顧客に提供します。 これらのオプションは、Azure AI Foundry リソースのモデル デプロイ時に使用できるさまざまなデプロイの種類 (または SKU) に変換されます。
このサービスには、 標準 とプロビジョニングの 2 種類のデプロイ が用意されています。 特定のデプロイの種類について、お客様はワークロードをデータ処理の要件に合わせて調整できます。 Azure の地域 (Standard または Provisioned-Managed)、Microsoft が指定したデータ ゾーン (DataZone- Standard または DataZone Provisioned-Managed)、またはグローバル (Global-Standard または Global Provisioned-Managed) 処理オプションを選択できます。
微調整されたモデルの場合、追加の Developer 展開の種類により、コスト効率の高いカスタム モデル評価手段が提供されますが、データ所在地は提供されません。
すべてのデプロイでまったく同じ推論操作を実行できますが、請求、スケール、パフォーマンスは大きく異なります。 ソリューション設計の一環として、次の 2 つのカテゴリで主要な決定を行う必要があります。
- データ処理の場所
- 通話ボリューム
Azure AI Foundry デプロイのデータ処理の場所
標準デプロイの場合は、グローバル、データ ゾーン、Azure 地域の 3 つのデプロイの種類のオプションから選択できます。 プロビジョニングされたデプロイの場合、グローバルと Azure の地域の 2 つのデプロイの種類のオプションから選択できます。 開始点としてグローバル標準をお勧めします。
グローバル展開
グローバル デプロイでは、Azure のグローバル インフラストラクチャを使用して、顧客の推論要求に最適な可用性を備えたデータセンターに顧客トラフィックを動的にルーティングします。 つまり、グローバルでは、初期スループットの上限と最適なモデルの可用性が提供されますが、アップタイム SLA と低待機時間が提供されます。 Standard および Global Standard で指定された使用レベルを超える大量のワークロードでは、待機時間の変動が増加する可能性があります。 ワークロードの使用量が大きい場合に待機時間の差異が小さい必要があるお客様には、プロビジョニングされたデプロイの種類を使用することをお勧めします。
グローバルデプロイは、すべての新しいモデルと機能の最初の場所です。 通話量に応じて、通話量が多く、待ち時間のばらつきが少ない要件を持つ顧客は、プロビジョニングされたデプロイタイプを考慮する必要があります。
データゾーンの配置
グローバルというラベルが付いたデプロイの種類の場合、プロンプトと応答は、関連する Azure AI Foundry モデルがデプロイされている任意の地域で処理される場合があります。 モデルのリージョンの可用性の詳細について説明します。
DataZone というラベルが付いた展開の種類の場合、プロンプトと応答は、Microsoft によって定義されているように、指定されたデータ ゾーン内の任意の地域で処理される可能性があります。 米国にある Azure AI Foundry リソースで DataZone デプロイを作成すると、プロンプトと応答が米国内の任意の場所で処理される可能性があります。 欧州連合の加盟国にある Azure AI Foundry リソースに DataZone デプロイを作成した場合、プロンプトと応答は、その他の欧州連合加盟国で処理される可能性があります。
グローバルデプロイと DataZone デプロイの両方の種類で、アップロードされたデータなど、保存時に格納されるすべてのデータは、顧客が指定した地域に格納されます。 お客様が Azure AI Foundry リソースで Global または DataZone デプロイの種類を使用する場合、処理の場所のみが影響を受けます。Azure データ処理とコンプライアンス コミットメントは引き続き適用されます。
注
グローバル標準とデータ ゾーン標準のデプロイの種類では、プライマリ リージョンでサービスが中断された場合、最初にこのリージョンにルーティングされたすべてのトラフィックが影響を受けます。 詳細については、 ビジネス継続性とディザスター リカバリー ガイドを参照してください。
グローバル標準
- コード内の SKU 名:
GlobalStandard
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、Azure AI Foundry の場所で推論のためにデータが処理される場合があります。 データ所在地の詳細を確認する。
グローバル デプロイは、グローバル以外のデプロイの種類と同じ Azure AI Foundry リソースで使用できます。 ただし、Azure のグローバル インフラストラクチャを使用して、要求ごとに最適な可用性でデータ センターにトラフィックを動的にルーティングできます。 Global Standard では、最高の既定のクォータが提供され、複数のリソース間で負荷分散する必要がなくなります。
ボリュームの整合性が高いお客様は、待機時間の変動が大きくなる可能性があります。 しきい値はモデルごとに設定されます。 詳細については、クォータページを参照してください。 ワークロードの使用量が大きい場合に待機時間の差異を小さくする必要があるアプリケーションの場合は、プロビジョニングされたスループットを購入することをお勧めします。
グローバルでプロビジョニング済み
- コード内の SKU 名:
GlobalProvisionedManaged
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、Azure AI Foundry の場所で推論のためにデータが処理される場合があります。 データ所在地の詳細を確認する。
グローバル デプロイは、グローバル以外のデプロイの種類と同じ Azure AI Foundry リソースで使用できます。 ただし、Azure のグローバル インフラストラクチャを使用して、要求ごとに最適な可用性でデータ センターにトラフィックを動的にルーティングできます。 グローバル プロビジョニング済みデプロイでは、Azure グローバル インフラストラクチャを使用して、高いスループットと予測可能なスループットを実現する予約済みモデルの処理能力が提供されます。
グローバル バッチ
- コード内の SKU 名:
GlobalBatch
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、Azure AI Foundry の場所で推論のためにデータが処理される場合があります。 データ所在地の詳細を確認する。
グローバル バッチ は、大規模で大量の処理タスクを効率的に処理するように設計されています。 要求の非同期グループは、個別のクォータと 24 時間の目標ターンアラウンドで処理でき、 グローバル標準よりも 50% 低コストです。 バッチ処理では、一度に 1 つの要求を送信するのではなく、1 つのファイルに多数の要求を送信します。 グローバル Batch 要求には、オンライン ワークロードの中断を回避する個別のエンキュートークン クォータがあります。
主なユース ケースは次のとおりです。
- 大規模なデータ処理: 広範なデータセットをすばやく並列で分析します。
- コンテンツの生成: 製品の説明や記事など、大量のテキストを作成します。
- ドキュメントのレビューと要約: 長いドキュメントのレビューと要約を自動化します。
- カスタマー サポートの自動化: 応答を高速化するために、多数のクエリを同時に処理します。
- データの抽出と分析: 膨大な量の非構造化データから情報を抽出および分析します。
- 自然言語処理 (NLP) タスク: 大規模なデータセットに対して感情分析や翻訳などのタスクを実行します。
- マーケティングとパーソナル化: パーソナライズされたコンテンツとレコメンデーションを大規模に生成します。
データ ゾーン標準
- コード内の SKU 名:
DataZoneStandard
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、データは、Microsoft が指定したデータ ゾーン内の任意の Azure AI Foundry の場所で推論のために処理される場合があります。 データ所在地の詳細を確認する。
Data Zone Standard デプロイは、他のすべての Azure AI Foundry デプロイの種類と同じ Azure AI Foundry リソースで使用できます。 ただし、Azure のグローバル インフラストラクチャを使用して、要求ごとに最適な可用性で Microsoft が定義したデータ ゾーン内のデータセンターにトラフィックを動的にルーティングできます。 Data Zone Standard では、Azure の地理ベースのデプロイの種類よりも高い既定のクォータが提供されます。
ボリュームの整合性が高いお客様は、待機時間の変動が大きくなる可能性があります。 しきい値はモデルごとに設定されます。 詳細については、 クォータと制限に関するページを参照してください。 大量の低待機時間変動を必要とするワークロードには、プロビジョニングされたデプロイメントサービスを使用することをお勧めします。
設定されたデータゾーン
- コード内の SKU 名:
DataZoneProvisionedManaged
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、データは、Microsoft が指定したデータ ゾーン内の任意の Azure AI Foundry の場所で推論のために処理される場合があります。 データ所在地の詳細を確認する。
Data Zone Provisioned デプロイは、他のすべての Azure AI Foundry デプロイの種類と同じ Azure AI Foundry リソースで使用できます。 ただし、Azure のグローバル インフラストラクチャを使用して、要求ごとに最適な可用性を持つ Microsoft が指定したデータ ゾーン内のデータセンターにトラフィックを動的にルーティングできます。 Data Zone Provisioned デプロイでは、Microsoft が指定したデータ ゾーン内の Azure インフラストラクチャを使用して、高い予測可能なスループットを実現する予約モデルの処理能力が提供されます。
データゾーンバッチ
- コード内の SKU 名:
DataZoneBatch
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、データは、Microsoft が指定したデータ ゾーン内の任意の Azure AI Foundry の場所で推論のために処理される場合があります。 データ所在地の詳細を確認する。
データ ゾーン バッチデプロイでは、 グローバル バッチ デプロイと同じ機能がすべて提供されます。 ただし、Azure のグローバル インフラストラクチャを使用して、要求ごとに最適な可用性を備えた Microsoft が定義したデータ ゾーン内のデータセンターにのみトラフィックを動的にルーティングできます。
Standard
- コード内の SKU 名:
Standard
標準デプロイでは、選択されたモデルで呼び出し単位の支払いの課金モデルが提供されます。 このモデルは、消費した分だけ支払うため、簡単に開始できます。 各リージョンで使用できるモデルとスループットが制限される場合があります。
標準的なデプロイメントは、バースト性が高く、少量から中規模のワークロード向けに最適化されています。 ボリュームの整合性が高いお客様は、待機時間の変動が大きくなる可能性があります。
リージョン プロビジョニング
- コード内の SKU 名:
ProvisionedManaged
リージョンにプロビジョニングされたデプロイでは、デプロイに必要なスループットの量を指定できます。 その後、サービスは必要なモデル処理容量を割り当て、その準備が整っていることを確認します。 スループットは、プロビジョニングされたスループット ユニットの観点から定義されます。これは、デプロイのスループットを表す正規化された方法です。 モデル とバージョンのペアごとに、デプロイするプロビジョニング済みスループット ユニットの量が異なり、プロビジョニングされたスループット ユニットごとに異なる量のスループットが提供されます。 プロビジョニングされたスループットの概念の詳細については、記事を参照してください。
サブスクリプション内のグローバル デプロイへのアクセスを無効にする
Azure Policy は、組織の標準を適用し、大規模なコンプライアンスを評価するのに役立ちます。 コンプライアンス ダッシュボードを通じて、環境の全体的な状態を評価するための集計ビューが提供され、リソースごと、ポリシーごとの細分性にドリルダウンできます。 既存のリソースの一括修復と新しいリソースの自動修復を使用して、お客様のリソースでコンプライアンスを実現するのにも便利です。 Azure Policy と AI サービスの特定の組み込みコントロールの詳細について説明します。
次のポリシーを使用して、任意の種類の Azure AI Foundry デプロイへのアクセスを無効にすることができます。 特定の展開の種類へのアクセスを無効にするには、 GlobalStandard を、アクセスを無効にするデプロイの種類の SKU 名に置き換えます。
{
"mode": "All",
"policyRule": {
"if": {
"allOf": [
{
"field": "type",
"equals": "Microsoft.CognitiveServices/accounts/deployments"
},
{
"field": "Microsoft.CognitiveServices/accounts/deployments/sku.name",
"equals": "GlobalStandard"
}
]
}
}
}
開発者 (微調整されたモデル用)
- コード内の SKU 名:
DeveloperTier
Von Bedeutung
静的データは指定された Azure の地域に残ります。 ただし、Azure AI Foundry の場所で推論のためにデータが処理される場合があります。 データ所在地の詳細を確認する。
微調整されたモデルは、カスタム モデル評価をサポートするように設計された Developer デプロイをサポートします。 データ所在地の保証や SLA は提供されません。
Developer展開の種類の使用の詳細については、微調整ガイドを参照してください。
モデルをデプロイする
リソースの作成とモデルのデプロイについては、 リソース作成ガイドを参照してください。