Azure AI Foundry のコストを効果的に管理することは、計画から始まります。 この記事では、デプロイ前に経費を見積もり、支出をリアルタイムで追跡し、予算の驚きを避けるためにアラートを設定する方法について説明します。
学習内容:
- Azure 料金計算ツールを使用してコストを見積もる
- さまざまなモデルの種類にわたる実際の支出を監視する
- 予算とアラートを作成して経費を管理する
- Azure でホストされるモデルとパートナー モデルの課金の違いを理解する
この記事では、 Azure AI Foundry のコストを計画および管理する方法について説明します。 まず、Azure 料金計算ツールを使用して、リソースを追加する前に Azure AI Foundry のコストを計画します。 次に、Azure リソースを追加するときに、推定コストを確認します。 Azure リソースの使用を開始したら、コスト管理機能を使用して予算を設定し、コストを監視します。
ヒント
Azure AI Foundry には、Azure 料金計算ツールに特定のページがありません。 Azure AI Foundry は、他のいくつかの Azure サービスで構成されており、その一部は省略可能です。 この記事では、料金計算ツールを使用して、これらのサービスのコストを見積もる方法について説明します。
Azure AI Foundry ポータルで Azure AI サービスを使用します。 Azure AI サービスのコストは、Azure の請求に記載された月額料金の一部にすぎません。 サード パーティのサービスを含め、Azure サブスクリプションで使用されているすべての Azure サービスとリソースに対して課金されます。 また、予測コストを確認し、支出の傾向を特定して、行動する可能性がある領域を見つけることもできます。
[前提条件]
コストを表示して分析するには、次のものが必要です。
- Cost Management データへの読み取りアクセス権を持つ Azure アカウント
- サポートされている Azure アカウントの種類の 1 つ
アクセス権を付与する必要がありますか? Cost Management データへのアクセスを割り当てる方法を参照してください。
Azure AI サービスを使用する前にコストを見積もる
Azure AI サービスを追加する前に、Azure 料金計算ツールを使用してコストを見積もります。
Azure 料金計算ツールで、Azure OpenAI などの製品を選択します。
使用する予定のユニット数を入力します。 たとえば、入力トークンの数を入力します。
複数の製品のコストを見積もるために、複数の製品を選択します。 たとえば、Azure AI Search を検索して選択し、潜在的なコストを考慮に入れます。
プロジェクトに新しいリソースを追加したら、この計算ツールに戻り、同じリソースをここに追加して、コストの見積もりを更新します。
Azure AI Foundry に関連するコスト
Azure AI Foundry リソースを作成すると、Azure OpenAI、Speech、Content Safety、Vision、Document Intelligence、Language などのサービスを使用する料金が発生します。 コストは、サービスごと、および各サービス内の一部の機能によって異なります。 詳細については、 Azure AI サービス の価格に関するページを参照してください。
Azure AI サービスの課金モデルを理解する
Azure AI サービスは、新しいリソースをデプロイするときにコストが発生する Azure インフラストラクチャ上で実行されます。 追加のインフラストラクチャでコストが発生する可能性があることを理解しておくことが重要です。 デプロイされたリソースに変更を加える場合は、このコストを管理する必要があります。
Azure AI サービス リソースを作成または使用すると、使用するサービスに基づいて課金されます。 Azure AI サービスでは、次の 2 つの課金モデルを使用できます。
サーバーレス API: サーバーレス API の価格では、課金情報に基づいて、使用する Azure AI サービスに従って課金されます。
コミットメント レベル: コミットメント レベルの価格では、固定料金で複数のサービス機能を使用することをコミットするので、ワークロードのニーズに基づいて予測可能な合計コストが得られます。 選択したプランに基づいて課金されます。 使用可能なサービス、サインアップ方法、プランを購入する際の考慮事項に関する情報については、クイックスタート: コミットメントレベルの料金体系を参照してください。
注
コミットメント プランによって提供されるクォータを超えるリソースを使用する場合は、コミットメント プランを購入するときに Azure portal の超過分の説明に従って、追加の使用量に対して支払います。
Foundry モデルの課金モデルを理解する
トークンベースの価格
言語モデルでは、入力をトークンに分割することで、入力を理解して処理します。 参考までに、各トークンは一般的な英語テキストの約 4 文字です。 画像やオーディオを処理できるモデルでは、課金目的でもトークンに分割されます。 画像またはオーディオ コンテンツあたりのトークン数は、モデルと入力の解像度によって異なります。
トークンあたりのコストは選択したモデル シリーズによって異なりますが、いずれの場合も、Azure AI Foundry にデプロイされたモデルは 1,000 トークンごとに課金されます。 たとえば、Azure OpenAI チャット入力候補モデルの推論は、モデルとデプロイの種類に応じて 料金が異なる 1,000 トークンごとに課金 されます。 ほとんどのモデルでは、価格が 100 万トークンの観点から一覧表示されるようになりました。
トークンのコストは、入力と出力の両方にかかります。 たとえば、モデルに Python への変換を依頼する 1,000 トークンの JavaScript コード サンプルがあるとします。 送信された最初の入力要求に対して約 1,000 トークン、合計 2,000 トークンに対して応答して受信される出力に対してさらに 1,000 トークンを支払います。
実際には、この種類の完了呼び出しでは、トークンの入力/出力は完全に 1:1 ではありません。 あるプログラミング言語から別のプログラミング言語に変換すると、多くの要因に応じて出力が長くなるか短くなる可能性があります。 そのような要因の 1 つは、 max_tokens パラメーターに割り当てられた値です。
Azure によって直接販売されるモデル
Azure によって直接販売されたモデル (Azure OpenAI を含む) は、直接課金されます。 各 Azure AI Foundry リソースの下に課金メーターとして表示されます。 Microsoft は、この課金を直接処理します。 請求書を調べると、消費される各モデルの入力と出力を考慮した課金メーターが表示されます。
パートナーとコミュニティからのモデル
Cohere などのサードパーティ プロバイダーによって提供されるモデルは、Azure Marketplace を使用して課金されます。 Microsoft の課金メーターとは異なり、これらのエントリは、Azure AI Foundry リソース自体ではなく、Azure AI Foundry リソースがデプロイされるリソース グループに関連付けられます。 モデル プロバイダーから直接課金されると、 Marketplace カテゴリのエントリと、消費される各モデルの入力と出力を考慮した サービス名SaaS が表示されます。
Important
Azure によって直接販売されるモデル (Azure OpenAI を含む) とパートナーとコミュニティのモデルの違いは、モデルがユーザーに提供される方法と課金方法にのみ影響します。 いずれの場合も、モデルは Azure クラウド内でホストされ、外部サービスやプロバイダーとの対話はありません。
微調整されたモデル
Azure OpenAI の微調整モデルは、 トレーニング ファイル内のトークンの数に基づいて課金されます。 最新の価格については、 公式の価格ページを参照してください。
微調整されたモデルがデプロイされると、次に基づいて課金されます。
- ホスティング時間。
- 1,000 トークンあたりの推論 (入力の使用状況と出力の使用量で分けます)。
微調整されたモデルがデプロイされた後も、アクティブに使用しているかどうかに関係なく時間単位のコストが引き続き発生するため、ホスティング時間のコストに注意することが重要です。 デプロイ済みの微調整モデルのコストを慎重に監視します。
Important
カスタマイズされたモデルをデプロイした後、いつでもデプロイが 15 日を超えて非アクティブな状態のままである場合、デプロイは削除されます。 カスタマイズされたモデルのデプロイは、モデルが 15 日以上前にデプロイされ、15 日間連続して完了またはチャットの完了呼び出しが行われなかった場合は 非アクティブです 。
非アクティブなデプロイは削除されても、基になるカスタマイズしたモデルは削除されず、影響を受けることもありません。カスタマイズしたモデルはいつでも再デプロイできます。
デプロイされるカスタマイズされた (微調整された) 各モデルでは、完了またはチャット完了の呼び出しがモデルに対して行われているかどうかに関係なく、1 時間ごとのホスティング コストが発生します。
HTTP エラー応答コードと課金状態
サービスで処理が実行されると、状態コードが成功でない場合 (200 以外) でも課金されます。 たとえば、コンテンツ フィルターまたは入力制限による 400 エラー、タイムアウトによる 408 エラーなどです。
サービスで処理が実行されていない場合は課金されません。 たとえば、認証による 401 エラーや、レート制限を超えた場合の 429 エラーなどです。
コストを監視する
Azure AI Foundry を使用すると、コストが発生します。 Azure リソース使用のユニット コストは、期間 (秒、分、時間、日数) やユニット使用量 (バイト、メガバイトなど) によって異なります。 発生したコストはコスト分析で確認できます。
コスト分析を使用すると、さまざまな時間間隔のグラフとテーブルにコストが表示されます。 たとえば、日単位、現在の月、以前の月、年単位などがあります。 予算や予想コストを基準としてコストを表示することもできます。 時間の経過に伴って長いビューに切り替えると、支出の傾向を特定し、オーバーペンドが発生する可能性がある場所を確認できます。 予算を作成したら、それを超過する部分を簡単に確認することもできます。
Azure AI Foundry のコストを監視する
コスト分析には 、Azure portal からアクセスできます。
Important
Azure AI Foundry のコストは、アプリケーション全体またはソリューション のコストのサブセットにすぎません。 アプリケーションまたはソリューションで使われるすべての Azure リソースのコストを監視する必要があります。
プロジェクトのコストを監視する方法の例を次に示します。 これらのコストはあくまでも例として使っています。 コストは、使っているサービスや使用量によって変わります。
Azure AI Foundry にサインインします。
プロジェクトを選択し、左側のメニューから 管理センター を選択します。
[ リソース ] 見出しの下にある [ 概要] を選択します。
[ リソースのプロパティ] で、リソース グループのリンクを選択します。 Foundry リソースのリソース グループに対して Azure portal が開きます。
[コスト分析] を選択します。
コストの概要が表示されます。 次のスクリーンショットに示すように、デプロイ レベル タグなどのフィルターを追加して、モデルのデプロイに基づくコストを確認することもできます。
リソース別コスト>リソースを選択して、[コスト分析] ページを開きます。
Foundry リソースのコストと、そのリソースの下の複数のモデル デプロイ間でそのコストの分割を確認できます。
メーター別のコスト内訳を理解する
コストの内訳を理解するには、Azure portal の Cost Analysis ツールを使用します。 推論のコストを理解するには、次の手順に従います。
Azure AI Foundry ポータルに移動します。
画面の右上隅で、Azure AI Foundry リソースの名前を選択するか、AI プロジェクトで作業している場合は、プロジェクトの名前を選択します。
プロジェクトの名前を選択します。 Azure portal が新しいウィンドウ内で開きます。
[コスト管理] で、 [コスト分析] を選択します。
既定では、コスト分析のスコープは、選択したリソース グループに設定されます。
Important
コスト分析のスコープを、Azure AI Foundry リソースをデプロイしたリソース グループに指定します。 パートナーとコミュニティのモデルに関連付けられているコスト メーターは、Azure AI Foundry リソースの代わりにリソース グループの下に表示されます。
[グループ化] を [メーター] に変更します。 これで、この特定のリソース グループについて、コストのソースが異なるモデル シリーズから取得されていることがわかります。
Azure によって直接販売されるモデル
Azure によって直接販売されたモデル (Azure OpenAI を含む) は、直接課金されます。 各 Azure AI Foundry リソースの下に課金メーターとして表示されます。 Microsoft は、この課金を直接処理します。 請求書を調べると、消費される各モデルの入力と出力を考慮した課金メーターが表示されます。
パートナーとコミュニティからのモデル
Cohere などのサードパーティ プロバイダーによって提供されるモデルは、Azure Marketplace を使用して課金されます。 Microsoft の課金メーターとは逆に、これらのエントリは、Azure AI Foundry リソース自体ではなく、Azure AI Foundry がデプロイされているリソース グループに関連付けられます。 モデル プロバイダーから直接課金されると、 Marketplace カテゴリのエントリと、消費される各モデルの入力と出力を考慮した サービス名SaaS が表示されます。
Important
Azure によって直接販売されるモデル (Azure OpenAI を含む) とパートナーとコミュニティのモデルの違いは、モデルがユーザーに提供される方法と課金方法にのみ影響します。 いずれの場合も、モデルは Azure クラウド内でホストされ、外部サービスやプロバイダーとの対話はありません。
リソース別にコストを監視する
コストをリソース別にグループ化することで、より詳細な課金情報を取得できます。
[コスト分析] で、[リソース別の表示>コスト] を選択します。
これで、各課金メーターを生成するリソースを確認できます。 そのコストを構成する内容の内訳を理解するために、 グループ化 を 測定 に変更し、グラフの種類を 折れ線に切り替えるのに役立ちます。
Azure OpenAI モデルと Microsoft モデルは、各 Azure AI サービス リソースの下にメーターとして表示されます。
一部のプロバイダーのモデルは、グローバル リソースのもとにメーターとして表示されます。 Global という単語は、モデル デプロイの SKU (グローバル標準など) に関連していません。 複数の Azure AI サービス リソースがある場合、請求書には、各 Azure AI サービス リソースの各モデルの、1 つのエントリが含まれます。 リソース メーターの形式は [model-name]-[GUID] です。ここで、[GUID] は、特定の Azure AI サービス リソースに関連付けられた一意の識別子です。 課金メーターでは、使用した各モデルの入力と出力が考慮されます。
Azure AI サービスに関連するコストを評価する場合は、スコープを理解することが重要です。 リソースが同じリソース グループの一部である場合は、そのレベルでコスト分析のスコープを設定して、コストへの影響を理解できます。 リソースが複数のリソース グループに分散している場合は、サブスクリプション レベルにスコープを設定できます。
より高いレベルでスコープを設定する場合は、多くの場合、Azure OpenAI の使用状況に焦点を当てるフィルターを追加する必要があります。 サブスクリプション レベルでスコープを設定すると、Azure OpenAI のコスト管理のコンテキストでは気にしない可能性がある他の多くのリソースが表示されます。 サブスクリプション レベルでスコープを設定する場合は、Cost Management サービスの下にある完全なコスト分析ツールに移動します。
コスト分析ツールを使用して、サブスクリプションまたはリソース グループの累積コストを確認する方法の例を次に示します。
- 上部の Azure 検索バーで Cost Management を検索して、完全なサービス エクスペリエンスに移動します。これには、予算の作成などのその他のオプションが含まれます。
- 必要に応じて、[スコープ: ] が分析するリソース グループまたはサブスクリプションを指していない場合は、[変更] を選択します。
- 左側で、 レポートと分析>コスト分析を選択します。
- [ すべてのビュー ] タブで、[ 累積コスト] を選択します。
コスト分析ダッシュボードには、 スコープに指定した内容に応じて分析された累積コストが表示されます。
サービス別にフィルターを追加しようとすると、一覧に Azure OpenAI が見つかりません。 この状況は、Azure OpenAI が、サービス レベル フィルターが Cognitive Services である Azure AI サービスのサブセットと共通性があるために発生します。 他の種類の Azure AI サービス リソースを使用せずに、サブスクリプション全体のすべての Azure OpenAI リソースを表示する場合は、代わりにサービス レベルにスコープを設定します。Azure OpenAI:
Azure Marketplace のモデルのコストを監視する
Azure Marketplace では、サーバーレス API デプロイが提供されます。 モデルパブリッシャーは、オファリングに応じて異なるコストを適用する場合があります。 Azure AI Foundry ポータルの各プロジェクトには、オファリングを含む独自のサブスクリプションがあります。このサブスクリプションを使用して、そのプロジェクトで発生しているコストと消費量を監視できます。 次のように Microsoft Cost Management を使ってコストを監視します。
Azure ポータルにサインインします。
ポータル メニュー アイコンを選択して、左側のウィンドウを開きます。
左側のウィンドウで、[ コスト管理 + 請求 ] を選択し、[ コスト管理] を選択します。
左側のウィンドウの [ レポートと分析] セクションで、[ コスト分析] を選択します。
[リソース] などのビューを選択します。 各リソースに関連付けられているコストが表示されます。
[種類] 列で、フィルター アイコンを選択して、[microsoft.saas/resources] の種類のすべてのリソースをフィルター処理します。 この種類は、Azure Marketplace で利用可能なオファーから作成されたリソースに対応します。 便宜上、SaaS 文字列を含むリソースの種類でフィルター処理できます。
プロジェクトごとに各モデル オファーに対して 1 つのリソースが表示されます。 これらのリソースの名前は[モデル オファー名]-[GUID]です。
選択してリソースの詳細を展開し、リソースに関連付けられている各コスト メーターにアクセスします。
- [レベル] は、オファリングを表します。
- [製品] は、オファリング内の特定の製品です。
一部のモデル プロバイダーは、両方に同じ名前を使用する場合があります。
ヒント
プロジェクトがサブスクライブするプランごとに、プロジェクトごとに 1 つのリソースが作成されます。
詳細を展開すると、オファリングに関連付けられている各メーターごとにコストのレポートがあります。 各メーターは、推論や微調整など、さまざまなコストのソースを追跡できます。 次のメーターが表示されます (一部のコストが関連付けられている場合)。
測定 グループ 説明 paygo-inference-input-tokens 基本モデル 基本モデルの推論の入力として使用されるトークンに関連付けられているコスト。 paygo-inference-output-tokens 基本モデル 基本モデルの推論の出力として生成されるトークンに関連付けられているコスト。 ペイゴーファインチューンモデル推論ホスティング 微調整されたモデル 微調整されたモデルの推論エンドポイントのホスティングに関連するコスト。 これはモデルをホスティングするコストではなく、それに対して機能するエンドポイントのコストです。 paygo-finetuned-model-inference-input-tokens 微調整されたモデル 微調整されたモデルの推論の入力として使用されるトークンに関連付けられたコスト。 paygo-finetuned-model-inference-output-tokens 微調整されたモデル 微調整されたモデルの推論の出力として生成されるトークンに関連付けられたコスト。
予算を作成する
自動アラートを使用してコスト超過を防ぎます。使用制限を追跡する予算を作成し、コストがしきい値に近づいたりしきい値を超えたときに通知するアラートを設定したりします。
ベスト プラクティス: 全体的なコスト監視戦略の一環として、Azure サブスクリプションとリソース グループの予算とアラートを作成します。
監視の粒度を高める場合は、Azure の特定のリソースまたはサービスのフィルターを使用して予算を作成します。 フィルターは、コストの高い新しいリソースを誤って作成しないようにするのに役立ちます。 予算を作成するときのフィルター オプションの詳細については、「 グループ化とフィルターのオプション」を参照してください。
Important
OpenAI には、予算を超過できないハード制限のオプションが用意されていますが、Azure OpenAI では現在、この機能は提供されていません。 予算通知の一部としてアクション グループから自動化を開始して、より高度なアクションを実行できますが、この機能には追加のカスタム開発が必要です。
コスト データのエクスポート
コスト データをストレージ アカウントにエクスポートできます。 データのエクスポートは、コストに対して追加のデータ分析を行う必要がある場合に役立ちます。 たとえば、財務チームは、Excel または Power BI を使用してデータを分析できます。 日単位、週単位、または月単位のスケジュールでコストをエクスポートし、カスタムの日付範囲を設定することができます。 コスト データのエクスポートは、推奨されるコスト データセット取得方法です。
発生する可能性があるその他のコスト
Azure Monitor ログへのデータの送信やアラートなどの機能を有効にすると、それらのサービスに対して追加のコストが発生します。 これらのコストは、それらの他のサービスとサブスクリプション レベルのもとで表示されますが、Azure AI サービス リソースのみにスコープが設定されている場合は表示されません。
Azure 前払いを使用する
Azure 前払い (以前は年額コミットメントと呼ばれる) クレジットを使用して、Azure の料金で直接販売されたモデルに対して支払うことができます。 ただし、他のプロバイダー モデルの料金は Azure Marketplace を通じて課金されるため、Azure 前払いクレジットを使用して料金を支払うことはできません。
詳細については、 Azure 料金計算ツールに関するページを参照してください。
関連コンテンツ
- Azure AI Foundry 管理センター
- Azure AI Foundry の状態ダッシュボード
- Cost Management でクラウド投資を最適化する方法を学習する。
- コスト分析を使用してコストを管理する方法について詳細に説明します。
- 予期しないコストを回避する方法について説明します。
- Cost Management のガイド付き学習コースを受講します。