Microsoft Fabric のデータ エージェントは、生成 AI を使用して独自の会話型 Q&A システムを構築できる新しい Microsoft Fabric 機能です。 Fabric データ エージェントにより、組織内のすべてのユーザーがデータ分析情報にアクセスし、アクションを実行できるようになります。 Fabric データ エージェントを使用すると、簡単な英語の質問を使って、組織の Fabric OneLake に保存されているデータについて会話し、関連する回答を受け取ることができます。 これにより、AI に関する技術的な専門知識を持たない人や、データ構造を深く理解していないユーザーでも、正確でコンテキストに富んだ回答を受け取ることができます。
また、組織固有の指示、サンプル、ガイダンスを追加して、Fabric データ エージェントを微調整することもできます。 これにより、応答が組織のニーズと目標と一致し、すべてのユーザーがより効果的にデータを操作できるようになります。 Fabric データ エージェントは、分析情報へのアクセスに対する障壁を下げ、コラボレーションを容易にすることでデータドリブン型の意思決定の文化を促進し、組織がデータからより多くの価値を引き出せるようにします。
重要
この機能は プレビュー段階です。
[前提条件]
- F2以上の有料ファブリック容量リソース
- ファブリック データ エージェントのテナント設定 が有効になっています。
- Copilot テナント スイッチ が有効になっています。
- AI のクロス geo 処理 が有効になっています。
- AI の地域間ストレージ が可能です。
- データを含む、ウェアハウス、レイクハウス、1 つ以上の Power BI セマンティック モデル、または KQL データベースのうち少なくとも 1 つ。
- Power BI セマンティック モデルのデータ ソースでは、XMLA エンドポイントテナントスイッチを介した Power BI セマンティック モデルが有効になります。
Fabric データ エージェントのしくみ
Fabric データ エージェントは、大規模言語モデル (LLM) を使用して、ユーザーが自然にデータを操作できるようにします。 Fabric データ エージェントは、Azure OpenAI Assistant API を適用し、エージェントのように動作します。 ユーザーの質問を処理し、最も関連性の高いデータ ソース (Lakehouse、Warehouse、Power BI データセット、KQL データベース) を決定し、クエリを生成、検証、実行するための適切なツールを呼び出します。 その後、ユーザーはプレーンな言語で質問し、構造化された人間が判読できる回答を受け取ることができ、複雑なクエリを記述する必要がなくなり、正確で安全なデータ アクセスを確保できます。
このしくみについて詳しく説明します。
質問の解析と検証: Fabric データ エージェントは、基になるエージェントとして Azure OpenAI Assistant API を適用してユーザーの質問を処理します。 このアプローチにより、質問がセキュリティ プロトコル、責任ある AI (RAI) ポリシー、およびユーザーのアクセス許可に準拠していることが保証されます。 Fabric データ エージェントは、読み取り専用アクセスを厳密に適用し、すべてのデータ ソースに対する読み取り専用のデータ接続を維持します。
データ ソースの識別: Fabric データ エージェントは、ユーザーの資格情報を使用してデータ ソースのスキーマにアクセスします。 これにより、ユーザーが閲覧権限を持つデータ構造情報がシステムによって取得されます。 次に、リレーショナル データベース (Lakehouse と Warehouse)、Power BI データセット (セマンティック モデル)、KQL データベースなど、使用可能なすべてのデータ ソースに対してユーザーの質問を評価します。 また、ユーザーが指定したデータ エージェントの指示を参照して、最も関連性の高いデータ ソースを特定する場合もあります。
ツールの呼び出しとクエリの生成: 正しいデータ ソースまたはソースが特定されると、Fabric データ エージェントは明確さと構造について質問を言い換え、対応するツールを呼び出して構造化クエリを生成します。
- リレーショナル データベース (Lakehouse/Warehouse) の SQL (NL2SQL) に対する自然言語。
- Power BI データセット (セマンティック モデル) の DAX (NL2DAX) に対する自然言語。
- KQL データベース向けの自然言語からKQL (NL2KQL) への変換。
選択したツールは、指定されたスキーマ、メタデータ、コンテキストに基づいてクエリを生成し、これを Fabric データ エージェントの基になるエージェントが渡します。
クエリの検証: ツールは検証を実行して、クエリの形式が正しく、独自のセキュリティ プロトコルと RAI ポリシーに準拠していることを確認します。
クエリ実行と応答: 検証が完了すると、Fabric データ エージェントは選択したデータ ソースに対してクエリを実行します。 結果は人間が判読できる応答に書式設定されます。これには、テーブル、概要、主要な分析情報などの構造化データが含まれる場合があります。
このアプローチにより、ユーザーは自然言語を使用してデータを操作できるようになります。一方、Fabric データ エージェントは、クエリの生成、検証、実行に伴う複雑さを処理します。ユーザーが SQL、DAX、または KQL 自体を記述する必要はありません。
Fabric データ エージェントの構成
Fabric データ エージェントの構成は、Power BI レポートを作成するのと似ています。まず、ニーズを満たすように設計と調整を行い、同僚がデータを操作できるように公開して共有します。 Fabric データ エージェントの設定には、次の作業が含まれます。
データ ソースの選択: Fabric データ エージェントは、レイクハウス、ウェアハウス、KQL データベース、Power BI セマンティック モデルなど、任意の組み合わせで最大 5 つのデータ ソースをサポートします。 たとえば、構成済みの Fabric データ エージェントに、5 つの Power BI セマンティック モデルが含まれる場合があります。 これには、2 つの Power BI セマンティック モデル、1 つの lakehouse、1 つの KQL データベースの組み合わせが含まれる場合があります。 使用可能なオプションは多数あります。
関連テーブルの選択: データ ソースを選択したら、それらを一度に 1 つずつ追加し、Fabric データ エージェントが使用する各ソースの特定のテーブルを定義する必要があります。 この手順により、Fabric データ エージェントは、関連するデータのみに焦点を当てて正確な結果を取得できます。
コンテキストの追加: Fabric データ エージェントの精度を向上させるために、Fabric データ エージェントの手順とクエリ例を使用して、より多くのコンテキストを提供できます。 このコンテキストは、Fabric データ エージェントの基になるエージェントとして、Azure OpenAI Assistant API がユーザーの質問を処理する際に、より多くの情報に基づいて意思決定を行い、回答に最適なデータ ソースはどれかを決定するのに役立ちます。
データ エージェントの手順: 特定の種類の質問に答える最適なデータ ソースを決定する際に、Fabric データ エージェントの基になるエージェントをガイドする手順を追加できます。 組織の用語や特定の要件を明確にするカスタムルールや定義を提供することもできます。 これらの手順では、エージェントがデータ ソースを選択してクエリを実行する方法に影響を与える、より多くのコンテキストまたは基本設定を提供できます。
- 財務メトリックに関する直接の質問を Power BI セマンティック モデルに送信します。
- 生データ探索に関連するクエリを lakehouse に割り当てます。
- ログ分析を必要とする質問を KQL データベースにルーティングします。
クエリの例: サンプルの質問とクエリのペアを追加して、Fabric データ エージェントが一般的なクエリにどのように応答するかを示すことができます。 これらの例は、エージェントのガイドとして機能し、同様の質問を解釈し、正確な回答を生成する方法を理解するのに役立ちます。
注
Power BI セマンティック モデルのデータ ソースでは、サンプル クエリと質問のペアの追加は現在サポートされていません。
明確な AI 命令と関連するクエリ例を組み合わせることにより、Fabric データ エージェントを組織のデータ ニーズに合わせて調整し、より正確でコンテキストに対応した応答を実現できます。
Fabric データ エージェントと Copilot の違い
Fabric データ エージェントと Fabric Copilot は、どちらも生成 AI を使用してデータの処理と推論を行いますが、その機能とユース ケースには大きな違いがあります。
構成の柔軟性: ファブリック データ エージェントは高度に構成可能です。 特定のシナリオに合わせて動作を調整するためのカスタム命令と例を提供できます。 一方、ファブリックの副操縦士は事前に構成されており、このレベルのカスタマイズは提供されません。
スコープとユース ケース: Fabric の副操縦は、ノートブック コードやウェアハウス クエリの生成など、Microsoft Fabric 内のタスクを支援するように設計されています。 一方、Fabric データ エージェントはスタンドアロンの成果物です。 幅広いユース ケースに Fabric データ エージェントの汎用性を広げるため、Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams、その他の Fabric 以外のツールなどの外部システムと統合できます。
Fabric データ エージェントの評価
Fabric データ エージェントの応答の品質と安全性は、厳密な評価を通過しています。
ベンチマーク テスト: 製品チームは、さまざまなパブリック データセットとプライベート データセットにわたって Fabric データ エージェントをテストし、高品質で正確な応答を保証しました。
強化された損害軽減策: ファブリック データ エージェントの出力が選択されたデータ ソースのコンテキストに集中し続け、無関係または誤解を招く回答のリスクを軽減するために、より多くのセーフガードが実施されています。
制限事項
Fabric データ エージェントは現在パブリック プレビュー段階であり、制限があります。 今後の更新で、Fabric データ エージェントは改善される見込みです。
- Fabric データ エージェントは、SQL、DAX、KQL の "読み取り" クエリのみを生成します。 データを作成、更新、または削除する SQL/DAX/KQL クエリは生成されません。
- Fabric Data Agent では、非構造化データ (.pdf、.docx、または .txt) はサポートされていません。 Fabric データ エージェントを使用して非構造化データ リソースにアクセスすることはできません。 これらのリソースには、たとえば、.pdf、.docx、または .txt ファイルが含まれます。
- 現在、Fabric データ エージェントは英語以外の言語をサポートしていません。 最適なパフォーマンスを得られるように、質問、手順、クエリの例を英語で入力してください。
- Fabric データ エージェントが使用する LLM を変更することはできません。