次の方法で共有


Azure Arc で有効になっている Edge RAG プレビューの拡張機能をデプロイする

前提条件の手順を完了したら、この記事の手順を実行して Edge RAG 拡張機能をデプロイします。

ローカル ハードウェアを必要とせずに Edge RAG を試すには、「 クイック スタート: Azure Arc で有効になっている Edge RAG プレビューをインストールする」を参照してください。

Von Bedeutung

Azure Arc により有効化された Edge RAG は、現在プレビュー段階です。 ベータ版、プレビュー版、または一般提供としてまだリリースされていない Azure の機能に適用される法律条項については、「Microsoft Azure プレビューの追加使用条件」を参照してください。

[前提条件]

開始する前 に、Edge RAG プレビューの展開の前提条件を完了してください。

拡張機能のデプロイ

Microsoft が提供する言語モデルで Azure portal または Azure CLI を使用して Edge RAG をデプロイするか、独自の言語モデルを追加します。

  1. Azure portal で、Azure Local 上の Azure Kubernetes クラスターに移動します。

  2. [設定]、>、+ 追加、そして一覧から>を選択します。

    Edge RAG が強調表示されているクラスターから追加できる拡張機能のスクリーンショット。

  3. [基本] タブで次の情報を指定します。

    フィールド 価値
    サブスクリプション Azure Local 上の Azure Kubernetes Service (AKS) クラスターを含むサブスクリプションを選択します。
    リソースグループ AKS Arc クラスターを含むリソース グループを選択します。
    デプロイ名 デプロイの一意な名前を指定します。
    リージョン Edge RAG をデプロイするリージョンを選択します。
    クラスター Edge RAG をデプロイするクラスターを選択します。

    プロジェクトとインスタンスの詳細を入力するフィールドを含む [基本] タブのスクリーンショット。

  4. 「Next: 構成」を選択します。

  5. [構成] タブで、次の情報を指定します。

    フィールド 価値
    展開モード 使用可能なハードウェアに応じて、GPU モードまたは CPU モードを選択します。
    モデル このセクションで入力する情報は、選択した言語モデルによって異なります。
    言語モデル デプロイする言語モデルを選択します。 Microsoft が提供する言語モデルまたは独自の言語モデルを選択します。
    Microsoft 言語モデル Microsoft 提供を選択した場合は、Microsoft が提供する言語モデルのいずれかを選択します。
    独自の言語モデルを追加する 独自の言語モデルを提供することを選択した場合は、次の情報を入力します。
    モデル名 言語モデルの名前を入力します。
    LLM エンドポイント http://some-endpointまたはhttps://some-endpointの形式で、大規模言語モデル (LLM) エンドポイントの名前を入力します。 たとえば、https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION> のようにします。
    最大トークン (k) 言語モデルの 4K から 2048 K までの数値範囲を入力します。
    SSL 設定
    SSL CNAME システムのドメイン名を指定します。 このドメイン名は、アプリの登録時に指定されたリダイレクト URI と同じです。
    Kubernetes SSL シークレット名 アプリケーションで使用する SSL シークレットのフレンドリ名を指定します。 既定では、Edge RAG は自己署名 SSL 証明書を使用して、この名前で kubernetes シークレット ストアに格納します。 インストール後、公式の署名付き証明書を使用して証明書を更新できます。
    アクセス
    Entra アプリ ID 認証の構成の一環として登録したアプリのアプリケーション ID を指定します (アプリの登録 > アプリ > 概要)。
    エントラ テナント ID 認証の構成の一環として登録したアプリからテナント ID を指定します (アプリの登録 > アプリ > 概要)。

    モデルの種類とその他の構成を選択する [構成] タブのスクリーンショット。

  6. [ 次へ: 確認と作成] を選択します。

  7. 指定したパラメーターを確認して検証します。

  8. [ 作成] を選択して、Edge RAG のデプロイを完了します。

  9. デプロイが完了したら、[ 拡張機能] で、拡張機能の種類 microsoft.arc.ragmicrosoft.extensiondiagnostics が一覧表示されていることを確認します。

Edge RAG 拡張機能のデプロイには通常約 30 分かかりますが、接続によっては時間がかかる場合があります。

独自の言語モデルを追加する

Edge RAG 拡張機能のデプロイ時に独自の言語モデルを追加した場合は、「 Edge RAG の "BYOM" エンドポイント認証を構成する」の手順を完了します。