この記事では、デプロイの作成に使用されたものとは異なるプロジェクトまたはハブで既存のサーバーレス API を構成する方法について説明します。
重要
プレビュー段階のモデルには、モデル カタログ内のモデル カードで "プレビュー" のマークが付けられます。
モデル カタログ内の特定のモデルは、サーバーレス API としてデプロイできます。 この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。 このデプロイ オプションでは、サブスクリプションからのクォータを必要としません。
デプロイの作成に使用されたものとは異なるプロジェクトまたはハブでサーバーレス API エンドポイントを使用する必要がある場合は、次のような状況で発生する可能性があります。
- 特定のプロジェクトまたはハブにデプロイを一元化し、組織内の異なるプロジェクトまたはハブから使う必要があります。
- モデルのサーバーレス デプロイを使用できる特定の Azure リージョンのハブにモデルをデプロイする必要があります。 しかしそれを、その特定のモデルに対してサーバーレス デプロイを使用できない別のリージョンから使う必要があります。
[前提条件]
有効な支払い方法を持つ Azure サブスクリプション。 無料または試用版の Azure サブスクリプションは機能しません。 Azure サブスクリプションを持っていない場合は、始めるために有料の Azure アカウントを作成してください。
ハブ ベースのプロジェクトを使用している場合は、Azure AI Foundry ハブを使います。 Foundry プロジェクトはハブを使用しません。 詳細については、「プロジェクトの 種類」を参照してください。
ない場合は、 ハブ ベースのプロジェクトを作成します。
サーバーレス API にデプロイされたモデル。 この記事では、前に Meta-Llama-3-8B-Instruct モデルをデプロイしたと想定しています。 このモデルをサーバーレス API としてデプロイする方法については、「モデルをサーバーレス API としてデプロイする」を参照してください。
Azure AI Foundry を使用するために、以下のソフトウェアをインストールする必要があります。
互換性のある任意の Web ブラウザーを使用して、Azure AI Foundry を操作できます。
サーバーレス API エンドポイント接続を作成する
次の手順に従って、接続を作成します。
エンドポイントがデプロイされているプロジェクトまたはハブに接続します。
ヒント
Azure AI Foundry ポータルで 左側のウィンドウをカスタマイズ できるため、これらの手順に示されている項目とは異なる項目が表示される場合があります。 探しているものが表示されない場合は、左側のペインの下部にある… もっと見るを選択してください。
Azure AI Foundryを開き、接続するエンドポイントがデプロイされているプロジェクトに移動します。
接続対象のエンドポイントの URL と資格情報を取得します。 この例では、エンドポイント名 meta-llama3-8b-qwerty の詳細を取得します。
Azure AI Foundry ポータルのプロジェクトの左サイド バーから、[マイ アセット]>[モデル + エンドポイント] の順に移動すると、プロジェクト内のデプロイの一覧が表示されます。
接続するデプロイを選びます。
[ターゲット URI] と [キー] の値をコピーします。
次に、接続を作成するプロジェクトまたはハブに接続します。
接続を作成する必要がある対象プロジェクトに移動します。
プロジェクトに接続を作成します。
Azure AI Foundry ポータルのプロジェクトから左側のサイド バーの下部に移動し、[管理センター] を選択します。
管理センターの左側のサイド バーから、[接続されたリソース] を選択します。
新規接続 を選択します。
[サーバーレス モデル] を選択します。
[ターゲット URI] には、前にコピーした値を貼り付けます。
[キー] には、前にコピーした値を貼り付けます。
接続に名前 (この場合は meta-llama3-8b-connection) を付けます。
[接続の追加] を選択します。
これで、接続が利用できるようになりました。
接続が機能していることを検証するには、次のようにします。
Azure AI Foundry ポータルでプロジェクトに戻ります。
プロジェクトの左側のサイド バーから、[ビルドとカスタマイズ]、> の順に移動します。
[作成] を選択して新しいフローを作成します。
[チャット フロー] ボックスで [作成] を選びます。
[プロンプト フロー] に名前を付け、[作成] を選びます。
グラフから [チャット] ノードを選択し、[チャット] セクションに移動します。
[接続] に対して、ドロップダウン リストを開いて、作成したばかりの接続 (この場合は meta-llama3-8b-connection) を選びます。
上部のナビゲーション バーから [コンピューティング セッションを開始する] を選択して、プロンプト フローの自動ランタイムを開始します。
[チャット] オプションを選びます。 メッセージを送信して応答を取得できるようになりました。