Fabric でのミラーリングは、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめる、低コストで待機時間の短いソリューションです。 既存のデータ資産を、さまざまな Azure データベースや外部データ ソースから Fabric の OneLake に継続的にレプリケートできます。
OneLake でクエリ可能な形式で最も up-to-date データを使用すると、Spark での分析の実行、ノートブックの実行、データ エンジニアリング、Power BI レポートによる視覚化など、Fabric のすべての異なるサービスを使用できるようになりました。
Fabric でのミラーリングにより、ユーザーは、分析ニーズを簡素化するように設計された、高度に統合された、エンドツーエンドで使いやすい製品を楽しむことができます。 Microsoft とオープンソースの Delta Lake テーブル形式を読み取ることができるテクノロジ ソリューション間のオープン性とコラボレーションのために構築されたミラーリングは、すべての分析ニーズに使用できる OneLake でデータのレプリカを作成できる、低コストで待機時間の短いターンキー ソリューションです。
その後、Delta テーブルをあらゆる場所の Fabric で使用できるため、ユーザーは Fabric への移行を加速できます。
ファブリックでミラーリングを使用する理由
今日、多くの組織は、サイロに置かれているミッション クリティカルな運用または分析データを持っています。
現在、このデータにアクセスして操作するには、複雑な ETL (抽出変換読み込み) パイプライン、ビジネス プロセス、意思決定サイロが必要であり、次のものが作成されます。
- 重要で常に変化するデータへの制限付きアクセスと制限付きアクセス
- 人、プロセス、テクノロジ間の摩擦
- 非常に重要なデータへのパイプラインとプロセスを作成するための長い待機時間
- 分析情報を快適に分析して共有するために必要なツールを自由に使用できない
- 人々がデータを共有し、共同作業するための適切な基盤がない
- BI、AI、統合、エンジニアリング、さらにはアプリなど、すべての分析シナリオに共通のオープン データ形式はありません
Fabric でのミラーリングを使用すると、分析情報と意思決定のための価値までの時間を短縮し、テクノロジ ソリューション間のデータ サイロを分解する簡単なエクスペリエンスが提供されます。
- BI と AI 用に組み込まれた組み込みの分析を使用した、SaaS データ レイクへのデータとメタデータのほぼリアルタイムのレプリケーション
Microsoft Fabric プラットフォームは、サービスとしてのソフトウェア (SaaS) の基盤上に構築されており、シンプルさと統合をまったく新しいレベルに引き上げます。 Microsoft Fabric の詳細については、「Microsoft Fabric とは」を参照してください。
ミラーリングでは、Fabric ワークスペースに次の項目が作成されます。
- ミラーリングでは、データとメタデータの OneLake へのレプリケーションと Parquet への変換が、分析対応形式で管理されます。 これにより、データ エンジニアリング、データ サイエンスなどのダウンストリーム シナリオが可能になります。
- SQL 分析エンドポイント
SQL クエリ エディターに加えて、SQL Server Management Studio (SSMS)、Visual Studio Code を使用した mssql 拡張機能、GitHub Copilotなど、ツールの広範なエコシステムがあります。
共有 により、アクセス制御と管理が容易になり、機密情報へのアクセスを確実に制御できます。 また、共有により、組織全体でセキュリティで保護され、民主化された意思決定が可能になります。
ミラーリングの種類
Fabric には、ミラーリングを通じて OneLake にデータを取り込むための 3 つの異なるアプローチが用意されています。
- データベース ミラーリング – Microsoft Fabric のデータベース ミラーリングを使用すると、データベースとテーブル全体をレプリケーションできるため、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめることができます。
- メタデータ ミラーリング – Fabric のメタデータ ミラーリングは、データを物理的に移動するのではなく、メタデータ (カタログ名、スキーマ、テーブルなど) を同期します。 この方法では ショートカットを利用し、データがソースに残り、Fabric 内で簡単にアクセスできるようにします。
- オープン ミラーリング – Fabric のオープン ミラーリングは、開いている Delta Lake テーブル形式に基づいてミラーリングを拡張するように設計されています。 この機能を使用すると、開発者は、オープン ミラーリングアプローチとパブリック API に基づいて、アプリケーションの変更データを Microsoft Fabric のミラー化されたデータベース項目に直接書き込みます。
現在、次の外部データベースを使用できます。
データベース ミラーリングのほぼリアルタイムレプリケーションはどのように機能しますか?
ミラーリングは、運用データ ソースへのセキュリティで保護された接続を作成することによって有効になります。 データベース全体または個々のテーブルをレプリケートするかどうかを選択すると、ミラーリングによってデータが自動的に同期されます。設定が完了すると、データは分析のために OneLake に継続的にレプリケートされます。
ミラーリングの主要な教義を次に示します。
Fabric でミラーリングを有効にすることは、複雑な ETL パイプラインを作成したり、他のコンピューティング リソースを割り当てたり、データ移動を管理したりすることなく、シンプルで直感的です。
Fabric でのミラーリングはフル マネージド サービスであるため、ミラーリングされた接続のレプリケーションのホスト、保守、管理について心配する必要はありません。
メタデータ ミラーリングのしくみ
ミラーリングでは、データ レプリケーションが可能になるだけでなく、完全なデータ レプリケーションではなく、ショートカットやメタデータ ミラーリングを使用して実現できるため、物理的に移動したり複製したりすることなくデータを使用できます。 このコンテキストでのミラーリングとは、実際のデータ自体ではなく、メタデータ (カタログ名、スキーマ、テーブルなど) のみをレプリケートすることを指します。 このアプローチにより、Fabric は、異なるソースのデータを複製することなくアクセス可能にし、データ管理を簡素化し、ストレージのニーズを最小限に抑えることができます。
たとえば、 Unity カタログに登録されているデータにアクセスする場合、Fabric は Azure Databricks のカタログ構造のみをミラー化し、基になるデータにショートカットを使用してアクセスできるようにします。 この方法により、ソース データの変更がファブリックに即座に反映されます。データ移動を必要とせず、リアルタイム同期を維持し、up-to-date 情報へのアクセスの効率を高めます。
開いているミラーリングのしくみ
データ ソースへのセキュリティで保護された接続を作成してデータ レプリケーションを有効にするミラーリングに加えて、既存のデータ プロバイダーを選択するか、独自のアプリケーションを作成して、ミラー化されたデータベースにデータを配置することもできます。 パブリック API または Fabric ポータルを使用して 、開いているミラー化されたデータベース を作成すると、OneLake でランディング ゾーンの URL を取得できます。この URL を使用すると、開いているミラーリングの仕様に従って変更データを配置できます。
データが適切な形式のランディング ゾーンに入ると、レプリケーションの実行が開始され、変更と更新、挿入、削除をマージして差分テーブルに反映する複雑さが管理されます。 この方法により、ランディング ゾーンに書き込まれたデータが直ちに Fabric up-to-date に保持されます。
共有
共有により、アクセス制御と管理が容易になりますが、行レベル セキュリティ (RLS) やオブジェクト レベル セキュリティ (OLS) などのセキュリティ制御が可能になり、機密情報へのアクセスをより確実に制御できます。 また、共有により、組織全体でセキュリティで保護され、民主化された意思決定が可能になります。
共有することで、ユーザーは、ワークスペースとその他の項目へのアクセス権を付与せずに、ミラー化されたデータベースへのアクセス権を他のユーザーまたはユーザーのグループに付与します。 他のユーザーがミラー化されたデータベースを共有すると、SQL 分析エンドポイントへのアクセスも許可されます。
詳細については、「 ミラー化されたデータベースの共有とアクセス許可の管理」を参照してください。
複数データベースにまたがるクエリ
ミラーリングされたデータベースのデータを OneLake に格納することで、データベース間クエリを記述し、ミラー化されたデータベース、ウェアハウス、Lakehouses の SQL 分析エンドポイントのデータを 1 つの T-SQL クエリで結合できます。 詳細については、「 データベース間クエリの記述」を参照してください。
たとえば、3 部構成の名前付けを使用して、ミラー化されたデータベースとウェアハウスからテーブルを参照できます。 次の例では、3 部構成の名前を使用して、倉庫ContosoSalesTableのContosoWarehouseを参照します。 他のデータベースまたはウェアハウスから、標準の SQL 3 部構成の名前付け規則の最初の部分は、ミラー化されたデータベースの名前です。
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
ミラーリングのコスト
データベース ミラーリングとオープン ミラーリングの場合、Fabric コンピューティングと OneLake ストレージは容量ベースの制限まで解放されます。
- レプリカのストレージは、容量サイズに基づいて上限まで解放されます。 ミラーリングでは、購入したすべての容量ユニット (CU) に対して無料のテラバイトのミラーリング ストレージが提供されます。 たとえば、F64 容量を購入すると、ミラーリング専用の 64 テラバイト分の無料ストレージが得られます。 OneLake ストレージは、無料ミラーリング ストレージの制限を超えた場合、または容量が一時停止された場合に課金されます。 詳細については、「 Microsoft Fabric の価格」を参照してください。
- データを Fabric OneLake にレプリケートするために使用されるバックグラウンド ファブリック コンピューティングは無料であり、容量は消費されません。 ミラーリングされたデータに対する OneLake への直接要求では、通常の OneLake コンピューティング消費量と同様に容量が消費されます。 SQL、Power BI、または Spark を使用してデータのクエリを実行するためのコンピューティングは、通常の料金で課金されます。
- 実行中のファブリック容量は、ミラーリングの初期セットアップにのみ必要です。
ミラー化されたデータベース データを使用したデータ エンジニアリング
Microsoft Fabric には、データに簡単にアクセスでき、適切に整理され、高品質になるように、さまざまなデータ エンジニアリング機能が用意されています。 Fabric Data Engineering では、次のことができます。
- Lakehouse を使用して Spark としてデータを作成および管理する
- データを lakehouse にコピーするパイプラインを設計する
- Spark ジョブ定義を使用してバッチ/ストリーミング ジョブを Spark クラスターに送信する
- ノートブックを使用してデータ インジェスト、準備、変換のコードを記述する
ミラー化されたデータベース データを使用したデータ サイエンス
Microsoft Fabric では、データ エンリッチメントとビジネス分析情報を目的として、ユーザーがエンド ツー エンドのデータ サイエンス ワークフローを完了できるようにする Fabric Data Science を提供しています。 データの探索、準備、クレンジングから実験、モデリング、モデルスコアリング、BI レポートへの予測分析情報の提供まで、データ サイエンス プロセス全体にわたる幅広いアクティビティを完了できます。
Microsoft Fabric ユーザーは 、データ サイエンス ワークロードにアクセスできます。 そこから、さまざまな関連リソースを検出してアクセスできます。 たとえば、機械学習の実験、モデル、ノートブックを作成できます。 また、データ サイエンスのホーム ページで既存のノートブックをインポートすることもできます。
ミラー化されたデータベース データを使用した Direct Lake
Microsoft Fabric のミラー化されたデータベースで Direct Lake モードを使用すると、データ移動や重複を必要とせずに、ミラー化されたデータに対して高パフォーマンスのクエリを実行できます。 ミラー化されたデータベースが作成されると、そのデータは OneLake 内の Delta Lake 形式で格納されます。 このネイティブ形式を使用すると、Power BI やその他の分析ツールを Direct Lake モードで接続でき、基になるファイルに直接アクセスすることで、ほぼリアルタイムの分析情報が提供されます。 この統合により、ミラーリングのシンプルさと Direct Lake の速度とスケーラビリティが組み合わせられ、運用データに関する迅速な up-to日付レポートが可能になります。
ミラー化されたデータの保持
Fabric でのミラーリングでは、Delta Lake テーブル形式で既存のデータ資産が OneLake に継続的にレプリケートされます。 ミラーリングされたデータを効率的に保存し、常に分析の準備を行うために、ミラーリングは自動的にバキュームを実行して、Delta ログによって参照されなくなった古いファイルを削除します。
保持設定は、要件に応じてカスタマイズできます。 たとえば、ミラーリング ストレージの使用量を減らすには短いリテンション期間を選択するか、Delta のタイム トラベル機能を分析に利用するためにリテンション期間を延長することができます。
2025 年 6 月中旬以降にファブリック ポータルから作成されたミラー化されたデータベースの場合、既定のリテンション期間は 1 日です。 古いミラー化されたデータベースの場合、既定値は 7 日間です。 保持設定を確認または更新するには、Fabric ポータルで、ミラー化されたデータベース ->Settings ->Maintenance タブに移動し、保持しきい値を指定します。
プロパティを指定してretentionInDays を使用して構成することもできます。
ファブリックのSQLデータベース
また、Fabric ポータル内 の Microsoft Fabric (プレビュー) で SQL データベース を直接作成および管理することもできます。 Azure SQL Database に基づいて、Fabric の SQL データベースは分析のために自動的にミラーリングされ、Fabric で運用データベースを簡単に作成できます。 SQL データベースは、OLTP ワークロード用の Fabric のホームであり、Fabric の ソース管理統合と統合できます。