次の方法で共有


標準デプロイとしてモデルをデプロイする

この記事では、モデル カタログからモデルを標準デプロイとしてデプロイする方法について説明します。

モデル カタログ内の特定のモデル は、Standard 課金を使用して標準デプロイとしてデプロイできます。 この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。 このデプロイ オプションでは、サブスクリプションからのクォータを必要としません。

この記事では、説明のために Meta Llama モデル デプロイを使用します。 ただし、同じ手順を使用して、 標準デプロイで使用できるモデル カタログ内の任意のモデルをデプロイできます。

前提条件

  • 有効な支払い方法を持つ Azure サブスクリプション。 無料または試用版の Azure サブスクリプションは機能しません。 Azure サブスクリプションを持っていない場合は、始めるために有料の Azure アカウントを作成してください。

  • Azure Machine Learning ワークスペース

  • Azure ロールベースのアクセス制御 (Azure RBAC) は、Azure Machine Learning の操作に対するアクセスを許可するために使用されます。 この記事の手順を実行するには、ご自分のユーザー アカウントに、リソース グループの Azure AI 開発者ロールを割り当てる必要があります。 アクセス許可について詳しくは、Azure Machine Learning でのロールベースのアクセス制御に関する記事をご覧ください。

  • Azure Machine Learning を使用するには、次のソフトウェアをインストールする必要があります。

    互換性のある任意の Web ブラウザーを使用して、Azure Machine Learning 内を移動できます。

モデル カタログでモデルとモデル ID を見つける

  1. Azure Machine Learning Studio にサインインします。

  2. Azure Marketplace を通じて提供されるモデルの場合は、リソース グループに対する Azure AI 開発者ロールのアクセス許可がアカウントにあることを確認するか、モデル オファリングのサブスクライブに必要なアクセス許可を満たしていることを確認します。

    Microsoft 以外のプロバイダー (Llama モデルや Mistral モデルなど) によって提供されるモデルは、Azure Marketplace を通じて課金されます。 このようなモデルの場合は、ワークスペースを特定のモデル オファリングにサブスクライブする必要があります。 Microsoft によって提供されるモデル (Phi-3 モデルなど) は、課金方法が異なるので、この要件はありません。 モデル カタログ内のモデルのサーバーレス デプロイに対する課金の詳細については、「 標準デプロイの課金」を参照してください。

  3. ワークスペースに移動します。 標準デプロイ オファリングを使用するには、ワークスペースが、デプロイする特定のモデル のサーバーレスデプロイでサポートされているいずれかのリージョン に属している必要があります。

  4. 左側のサイドバーから [モデル カタログ] を選び、デプロイするモデルのモデル カードを見つけます。 この記事では、Meta-Llama-3-8B-Instruct モデルを選びます。

    1. Azure CLI、Python SDK、または ARM を使用してモデルをデプロイする場合は、モデル ID をコピーします。

    重要

    モデル ID をコピーするときにバージョンを含めないでください。標準デプロイでは、モデルの最新バージョンが常にデプロイされます。 たとえば、モデル ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3 の場合は、azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct をコピーします。

    モデルの詳細ページを示すスクリーンショット。

次のセクションでは、モデル オファリングにワークスペースをサブスクライブする手順について説明します。 Microsoft モデルをデプロイする場合は、このセクションをスキップし、「 標準デプロイにモデルをデプロイする」に進むことができます。

モデル オファリングに対してワークスペースをサブスクライブする

標準デプロイでは、Microsoft と Microsoft 以外の両方の提供モデルをデプロイできます。 Microsoft モデル (Phi-3 モデルなど) の場合、Azure Marketplace サブスクリプションを作成する必要はありません。また、 それらを標準デプロイに直接デプロイして 予測を使用できます。 Microsoft 以外のモデルの場合は、最初にサブスクリプションを作成する必要があります。 ワークスペースにモデルを初めてデプロイする場合は、Azure Marketplace から特定のモデル オファリングに対してワークスペースをサブスクライブする必要があります。 ワークスペースごとに、モデルの特定の Azure Marketplace オファリングへの固有のサブスクリプションがあり、それを使って支出を管理およびモニターできます。

Azure Marketplace を通じて提供されるモデルは、特定のリージョンの標準デプロイにデプロイできます。 標準デプロイのモデルのリージョンの可用性を確認して、使用可能なモデルとリージョンを確認します。 必要なワークスペースが一覧にない場合は、サポートされているリージョンのワークスペースにデプロイし、 別のワークスペースから標準のデプロイを使用できます。

  1. モデルのマーケットプレース サブスクリプションを作成します。 サブスクリプションを作成するときに、モデル オファーに関連付けられているご契約条件に同意します。 Microsoft が提供するモデル (Phi-3 など) に対してこの手順を実行する必要はありません。

    1. モデルの [詳細] ページで、[デプロイ] を選択します。 [デプロイ オプション] ウィンドウが開き、マネージド コンピューティングを使用した標準デプロイとデプロイの選択が可能になります。

      標準デプロイでのみデプロイできるモデルの場合は、モデルの詳細ページから [ 配置 ] を選択した直後に標準展開ウィザードが開きます。

    2. Azure AI Content Safety (プレビュー) で標準デプロイを選択して、標準デプロイ ウィザードを開きます。

    3. Microsoft の購入ポリシーに同意するチェック ボックスをオンにします。

      標準デプロイ オプションを使用してモデルをデプロイする方法を示すスクリーンショット。

    4. 「You already have an Azure Marketplace subscription for this workspace (このワークスペースの Azure Marketplace サブスクリプションが既にある)」というメモが表示される場合は、サブスクリプションを既に持っているため、作成する必要はありません。 「モデルを標準デプロイにデプロイする」に進むことができます。

    5. デプロイ ウィザードで、[Azure Marketplace の使用条件] へのリンクを選び、使用条件の詳細を確認します。 [Pricing and terms] (価格と条件) タブを選択して、選択したモデルの価格について確認することもできます。

    6. デプロイ ウィザードで、リンク [Azure Marketplace の使用条件] を選択して、使用条件の詳細を確認します。 [Marketplace オファーの詳細] タブを選択して、選択したモデルの価格について確認することもできます。

    7. [サブスクライブしてデプロイ] を選択します。

  2. 特定の Azure Marketplace オファリング用にワークスペースをサブスクライブすると、"同じ" ワークスペース内の "同じ" オファリングの以降のデプロイで再度サブスクライブする必要はありません。

  3. ワークスペースが現在サブスクライブしているモデル オファーは、いつでも確認できます。

    1. Azure portal に移動します

    2. ワークスペースが属するリソース グループに移動します。

    3. [種類] フィルターで、[SaaS] を選択します。

    4. 現在サブスクライブしているすべてのオファリングが表示されます。

    5. 詳細を表示するには、リソースを選びます。

標準デプロイにモデルをデプロイする

Microsoft 以外のモデルのサブスクリプションを作成したら、関連付けられているモデルを標準のデプロイにデプロイできます。 Microsoft モデル (Phi-3 モデルなど) の場合、サブスクリプションを作成する必要はありません。

標準デプロイでは、モデルをサブスクリプションでホストせずに API として使用しながら、企業のセキュリティとコンプライアンス組織のニーズを維持する方法が提供されます。 このデプロイ オプションでは、サブスクリプションからのクォータを必要としません。

このセクションでは、meta-llama3-8b-qwerty という名前のエンドポイントを作成します。

  1. サーバーレス エンドポイントを作成する

    1. モデル オファリングをサブスクライブする必要のない Microsoft モデルをデプロイするには、[ デプロイ ] を選択し、 Azure AI Content Safety (プレビュー) を使用して標準デプロイ を選択してデプロイ ウィザードを開きます。

    2. または、モデル サブスクリプションを必要とする Microsoft 以外のモデルの場合、前のセクションでワークスペースをモデル オファーにサブスクライブしたばかりの場合は、[デプロイ] の選択に進みます。 または、デプロイ ウィザードに、このワークスペースの Azure Marketplace サブスクリプションが既にあることを示すメモが含まれている場合は、[Continue to deploy]\(デプロイに進む\) を選択します。

      既にオファリングに対してサブスクライブしているワークスペースを示すスクリーンショット。

    3. デプロイに名前を付けます。 この名前は、デプロイ API URL の一部になります。 この URL は、Azure リージョンごとに一意である必要があります。

      作成対象のデプロイの名前を指定する方法を示すスクリーンショット。

      ヒント

      [コンテンツ フィルター (プレビュー)] オプションは、既定で有効になっています。 サービスの既定の設定をそのままにして、ヘイト、自傷行為、性的、暴力コンテンツなどの有害なコンテンツを検出します。 コンテンツ フィルタリング (プレビュー) の詳細については、「 標準のデプロイを使用してデプロイされたモデルのコンテンツの安全性」を参照してください。

    4. 展開 を選択します。 デプロイの準備ができるまで待つと、[デプロイ] ページにリダイレクトされます。

  2. いつでも、ワークスペースにデプロイされたエンドポイントを確認できます。

    1. ワークスペースに移動します。

    2. [エンドポイント] を選択します。

    3. [ サーバーレス エンドポイント ] タブを選択して、標準の展開を表示します。

  3. 作成されたエンドポイントは、承認にキー認証を使用します。 次の手順を使用して、特定のエンドポイントに関連付けられているキーを取得します。

    1. デプロイのページに戻るには、サーバーレス エンドポイントの一覧からエンドポイントの名前を選びます。
    2. エンドポイントの [ターゲット URI][キー] をメモします。 これらを使用してデプロイを呼び出し、予測を生成します。

    Azure portal を使用する場合、リソース グループに標準デプロイは既定では表示されません。 リソース グループに表示するには、[非表示の種類を表示] オプションを使用します。

  4. この時点で、エンドポイントを使用する準備ができました。

  5. 別のワークスペースからこのデプロイを使用する必要がある場合、またはプロンプト フローを使用してインテリジェント なアプリケーションを構築する予定の場合は、標準デプロイへの接続を作成する必要があります。 新しいワークスペースまたはハブで既存の標準デプロイを構成する方法については、「別のワークスペース またはプロンプト フローからデプロイされた標準デプロイを使用する」を参照してください。

    ヒント

    デプロイがデプロイされたのと同じワークスペースでプロンプト フローを使用する場合でも、接続を作成する必要があります。

標準デプロイを使用する

標準デプロイで Azure Machine Learning と Azure AI Foundry にデプロイされたモデルは、基本モデルの共通の機能セットを公開する Azure AI モデル推論 API を サポートしています。これは、開発者がさまざまなモデルセットからの予測を均一かつ一貫した方法で使用するために使用できます。

この API の機能と、アプリケーションを構築するときのその使用方法について詳細を確認してください。

エンドポイントとサブスクリプションを削除する

モデルのサブスクリプションとエンドポイントを削除できます。 モデル サブスクリプションを削除すると、関連付けられているエンドポイントは [異常] になり、使用できなくなります。

標準デプロイを削除するには:

  1. [Azure Machine Learning Studio] に移動します。

  2. 左側のサイドバーで [エンドポイント] を選びます。

  3. [ サーバーレス エンドポイント ] タブを選択して、標準の展開を表示します。

  4. 削除するエンドポイントを開きます。

  5. [削除] を選択します。

関連付けられているモデル サブスクリプションを削除するには、次のようにします。

  1. Azure portal に移動します

  2. ワークスペースが属するリソース グループに移動します。

  3. [種類] フィルターで、[SaaS] を選択します。

  4. 削除するサブスクリプションを選択します。

  5. [削除] を選択します。

標準デプロイとしてデプロイされるモデルのコストとクォータに関する考慮事項

クォータはデプロイごとに管理されます。 各デプロイのレート制限は、1 分あたり 200,000 トークン、1 分あたり 1,000 個の API 要求です。 ただし現在、ワークスペースのモデルごとにデプロイを 1 つに制限しています。 現在のレート制限がシナリオに十分でない場合は、Microsoft Azure サポートにお問い合わせください。

Microsoft モデルのコスト

価格情報は、Microsoft モデル (Phi-3 モデルなど) を標準のデプロイとして展開するときに、展開ウィザードの [価格と用語 ] タブで確認できます。

Microsoft 以外のモデルのコスト

標準デプロイとしてデプロイされた Microsoft 以外のモデルは、Azure Marketplace を通じて提供され、使用するために Azure AI Foundry と統合されます。 これらのモデルをデプロイまたはモデルを微調整するときに、Azure Marketplace の価格を確認できます。

ワークスペースが Azure Marketplace から特定のオファーにサブスクライブするたびに、その使用に関連するコストを追跡するための新しいリソースが作成されます。 推論と微調整に関連するコストを追跡するために同じリソースが使用されますが、各シナリオを個別に追跡するために複数の測定値を使用できます。

コストを追跡する方法の詳細については、「Azure Marketplace を通じて提供されるモデルのコストを監視する」を参照してください。

さまざまなモデル オファーとその関連するメーターに対応するさまざまなリソースを示すスクリーンショット。

モデル オファリングをサブスクライブするために必要なアクセス許可

Azure ロールベースのアクセス制御 (Azure RBAC) は、Azure Machine Learning の操作に対するアクセスを許可するために使用されます。 この記事の手順を実行するには、ユーザー アカウントに、Azure サブスクリプションの所有者共同作成者、または Azure AI 開発者ロールを割り当てる必要があります。 別の方法として、アカウントに、次のアクセス許可を持つカスタム ロールを割り当てることができます。

  • Azure サブスクリプションで - ワークスペースを Azure Marketplace オファリングにサブスクライブするため、各ワークスペースに対して 1 回、オファリングごと:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • リソース グループで - SaaS リソースを作成して使用するため:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • ワークスペースで - エンドポイントをデプロイするため (Azure Machine Learning データ サイエンティスト ロールには、既に次のアクセス許可が含まれています):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

アクセス許可の詳細については、「Azure Machine Learning ワークスペースへのアクセスの管理」を参照してください。