Edge RAG は、エッジ環境とハイブリッド環境に生成 AI 機能を提供し、独自のデータを使用するセキュリティで保護されたスケーラブルでインテリジェントなチャット ソリューションをデプロイできるようにします。 この記事では、Azure Arc を使用して Edge RAG をデプロイするためのデプロイ プロセス、主要なコンポーネント、およびワークフローの概要について説明します。
ローカル ハードウェアを必要とせずに Edge RAG を試すには、「 クイック スタート: Azure Arc で有効になっている Edge RAG プレビューをインストールする」を参照してください。
Important
Azure Arc で有効になっている Edge RAG プレビューは、現在プレビュー段階です。 ベータ版、プレビュー版、または一般提供としてまだリリースされていない Azure の機能に適用される法律条項については、「Microsoft Azure プレビューの追加使用条件」を参照してください。
Edge RAG のアーキテクチャとコンポーネント
次の図は、環境を準備して Edge RAG をデプロイした後の主要なコンポーネントとアーキテクチャを示しています。 これには、Azure リソース、オンプレミス インフラストラクチャ、統合ポイントが含まれます。
図のリソースとコンポーネントは、Edge RAG のコア インフラストラクチャを形成します。
Azure リソース: Microsoft Entra ID と Azure Arc は、ID、アクセス、ハイブリッド管理を提供します。
オンプレミス インフラストラクチャ: これらのコンポーネントは、Edge RAG 拡張機能を実行し、Edge RAG にローカルでアクセスするために必要なコンピューティング、ネットワーク、負荷分散、ストレージを提供します。
- Azure Local
- Azure Local 上の Azure Kubernetes (AKS) クラスター
- MetalLB
- AKS ノード プール
- ネットワーク ファイル共有 (NFS) サーバー
- ドライバー マシン (ローカル管理ホスト)
ドライバー マシン (ローカル管理ホスト) を使用して、Azure Local での Azure Arc 対応 Kubernetes クラスターの管理を簡略化します。 詳細については、「 Azure Local for Edge RAG で AKS クラスターを準備 する」および「 Azure Arc-Enabled Kubernetes クラスターを管理するようにマシンを構成する」を参照してください。
このセットアップにより、エッジで独自のデータを使用する、セキュリティで保護されたスケーラブルな AI を利用したチャット ソリューションを実行できます。
主要な構成オプション
Edge RAG をデプロイするときに、環境と要件に合わせてソリューションを調整するために、いくつかの構成オプションを設定できます。
- 言語モデルの選択: Microsoft が提供するモデル (Phi-3.5 や Mistral-7B など) を選択するか、独自のモデル (BYOM) エンドポイントを使用します。
- SSL とドメインの構成: チャット エンドポイントに安全にアクセスできるように、トランスポート層セキュリティ (TLS) 終了証明書とドメインを設定します。
- アクセスと認証: Entra アプリ ID を設定し、ユーザーとグループにロールを割り当てます。
- データ ソースの構成: NFS サーバーに到達可能で、サポートされている形式の必要なファイルがあることを確認します。
Edge RAG のデプロイ プロセス
Edge RAG の展開プロセスは、次の大まかな手順で構成されます。
| 大まかな手順 | Description |
|---|---|
| 1. 環境を準備する | 必要な Azure とオンプレミスのインフラストラクチャを設定し、AKS Arc クラスターとノード プールを構成し、ネットワークとストレージを確立し、認証とユーザー ロールを設定します。
要件を確認し、前提条件のチェックリストを完了します。 前提条件の一部として、Microsoft が提供するモデルの 1 つではなく独自の言語モデルを使用する場合は、 Edge RAG に使用するエンドポイントを作成します。 Microsoft Azure Government を使用している場合は、「Azure Government とグローバル Azure を比較して、Edge RAG を使用したデプロイのバリエーションを比較する」を参照してください。 |
| 2. Edge RAG 拡張機能をデプロイする | Azure portal または CLI を使用して、AKS Arc クラスターに拡張機能をインストールします。 優先する言語モデルを選択して構成し、セキュリティとアクセスのパラメーターを設定し、認証のために拡張機能を Microsoft Entra ID に接続します。 「 Edge RAG 拡張機能をデプロイする」を参照してください。 展開手順の一環として、Microsoft が提供するモデルではなく独自の言語モデルを使用するように Edge RAG を構成した場合は、 Edge RAG の "BYOM" エンドポイント認証を構成します。 |
| 3.デプロイを検証する | 拡張機能をデプロイした後、Edge RAG 拡張機能がクラスターにインストールされて実行されていること、およびチャット エンドポイントに接続されていることを確認します。 |
| 4. チャット ソリューションを構成する | チャット ソリューションを組織で使用できるようにする前に、データ ソース、ユーザー エクスペリエンスを構成し、セットアップをテストして要件を満たしていることを確認します。 Edge RAG のデータ ソースの追加、チャット ソリューションの構成、チャット ソリューションのテストを参照してください。 |
| 5. デプロイの監視と評価 | Edge RAG をデプロイした後、システムの正常性を監視し、パフォーマンスを追跡し、AI ソリューションの品質を評価します。 組み込みのメトリックと評価ツールを使用して、デプロイを観察、評価、最適化します。 「 Edge RAG システムの評価」 および 「エッジ RAG の監視」を参照してください。 |