コピー ジョブを使用してデータ分析プロジェクトを正常に実行するには、ソース管理、継続的インテグレーション、継続的配置、コラボレーション環境を使用する必要があります。
Microsoft Fabric には、Git 統合とデプロイ パイプラインという 2 つの主要なツールがあります。 これにより、ワークスペース リソースを管理し、必要に応じて更新できます。
Git 統合とデプロイ パイプラインを使用すると、Azure DevOps または GitHub で独自の Git リポジトリを接続し、Fabric の組み込みデプロイ ツールを使用できます。 これにより、スムーズな CI/CD ワークフローを簡単に設定できるため、自信を持ってデータ プロジェクトをビルド、テスト、デプロイできます。
さらに、変数ライブラリのサポートにより、コピー ジョブで接続をパラメーター化できます。 この強力な機能により、接続値を外部化することで CI/CD が効率化され、変数ライブラリによってステージごとに正しい接続が挿入される間、複数の環境に同じコピー ジョブをデプロイできます。
コピー ジョブの Git 統合
Data Factory のコピー ジョブを Git に接続するには、次の手順に従います。 これにより、変更を追跡し、チームと連携し、作業を安全に保つことができます。
Git 統合の前提条件
- Power BI Premium ライセンスまたはファブリック容量が必要です。
- 次の管理者設定が有効になっていることを確認します。
- Azure DevOps 組織または GitHub アカウントが必要です。
- Azure DevOps の場合:
- 無料の Azure アカウント をお持ちでない場合は、サインアップしてください。
- リポジトリにアクセスできることを確認します。
- GitHub の場合:
- 無料の GitHub アカウント をお持ちでない場合は、サインアップしてください。
- コンテンツの読み取りと書き込みのアクセス許可を持つきめ細かいトークン、またはリポジトリ スコープが有効になっている GitHub クラシック トークンが必要です。
- Azure DevOps の場合:
手順 1: Git リポジトリに接続する
Fabric で Git とコピー ジョブの統合を使用するには、まず Git リポジトリに接続する必要があります。
Fabric にサインインし、Git に接続するワークスペースに移動します。
[ワークスペースの設定] を選択します。
[Git 統合] を選択します。
Git プロバイダー ( Azure DevOps または GitHub) を選択します。 GitHub を選択した場合は、[ アカウントの追加] を選択して GitHub アカウントを接続します。 サインインしたら、[ 接続 ] を選択して、Fabric が GitHub アカウントにアクセスできるようにします。
手順 2: ワークスペースに接続する
Git リポジトリに接続したら、ワークスペースに接続する必要があります。
ドロップダウン メニューから、使用するワークスペースとブランチの詳細を入力します。
Azure DevOps の場合:
- 組織名
- プロジェクト名
- リポジトリ名
- ブランチ名
- フォルダー名
GitHub の場合:
- リポジトリ URL
- ブランチ名
- フォルダー名
[接続と同期] を選択します。
接続後、リンクされたブランチ、各項目の状態、および最後に同期された日時に関する情報については、[ ソース管理] を選択します。
手順 3: Git に変更をコミットする
次の手順に従って、Git に変更をコミットできます。
- 自分のワークスペースに移動します。
- [ソース管理] アイコンを選びます。 コミットされていない変更の数を示す数値が表示されます。
- [ ソース] コントロール パネルで、[ 変更 ] タブを選択します。変更した内容の一覧とステータス アイコンが表示されます。
- コミットする項目を選択します。 すべてを選択するには、上部にあるチェック ボックスをオンにします。
- (省略可能)変更に関するコミット コメントを追加します。
- [コミット] を選択します。
コミットすると、それらの項目は一覧から消え、ワークスペースは最新のコミットを指します。
Git 用のデプロイ パイプライン
Fabric ワークスペースで Git デプロイ パイプラインを使用するには、次の手順に従います。
デプロイ パイプラインの前提条件
作業を開始する前に、必ず以下の前提条件を設定してください。
- アクティブな Microsoft Fabric サブスクリプション。
- Fabric ワークスペースの管理者アクセス。
手順 1: デプロイ パイプラインを作成する
- [ワークスペース] メニューの [デプロイ パイプライン] を選択します。
- [ デプロイ パイプラインの作成 ] ウィンドウが開いたら、パイプラインの名前と説明を入力し、[ 次へ] を選択します。
- パイプラインに必要なステージの数を選択します。 既定では、 開発、 テスト、 運用の 3 つのステージが表示されます。
手順 3: ワークスペースをデプロイ パイプラインに割り当てる
パイプラインを作成したら、管理したいコンテンツをパイプラインに追加する必要があります。 パイプラインにコンテンツを追加するには、任意のパイプライン ステージにワークスペースを割り当てます。
デプロイ パイプラインを開きます。
ワークスペースを割り当てたいステージで、[このステージにコンテンツを割り当てる] というタイトルのドロップダウンを展開します。
このステージに割り当てたいワークスペースを選択します。
[割り当て] を選択します。
空のステージにデプロイする
あるパイプライン ステージから次のパイプライン ステージにコンテンツを移動する準備ができたら、次のいずれかのオプションを使用してコンテンツをデプロイできます。
- 完全なデプロイ: 現在のステージのすべてのものを次のステージにデプロイするには、これを選択します。
- 選択的デプロイ: デプロイする項目のみを選択します。
- 後方展開: 後のステージから以前のステージにコンテンツを移動します。 これは、ターゲット ステージが空 (ワークスペースが割り当てられていない) 場合にのみ実行できます。
デプロイ オプションを選択したら、 詳細を確認し、必要に応じてデプロイに関するメモを残すことができます。
あるステージから別のステージへのコンテンツのデプロイ
パイプライン ステージにコンテンツを含めたら、次のステージのワークスペースにコンテンツが含まれている場合でも、次のステージに配置できます。 ペアになっている項目 は上書きされます。 このプロセスの詳細については、 既存のワークスペースへのコンテンツのデプロイに関する 記事を参照してください。
デプロイ履歴を確認して、各ステージにコンテンツが最後にデプロイされた時刻を確認することもできます。 デプロイする前に 2 つのパイプラインの違いを確認するには、「異なるデプロイ ステージのコンテンツの比較」を参照してください。
コピー ジョブの変数ライブラリを使用した接続パラメーター化
変数ライブラリを使用してコピー ジョブの接続をパラメーター化するには、次の操作を行います。 変数ライブラリの詳細を確認します。
手順 1: 変数ライブラリを作成する
Fabric で [+ 新しい項目] を選択して変数ライブラリを作成します。
[新しい変数ライブラリ] ウィンドウが開いたら、変数ライブラリの名前を入力し、[作成] を選択します。
[ + 新しい変数 ] を選択して、ソース接続と宛先接続の両方に新しい変数を作成します。
開発、テスト、運用など、さまざまな環境の変数に異なる接続 ID を値セットとして追加します。 [設定] から接続の ID を検索できます 。接続とゲートウェイを管理します。 接続名の横にある [設定] をクリックすると、接続の ID が表示されます。
手順 2: コピー ジョブで変数ライブラリを使用する
コピー ジョブを開きます。
ソースと宛先の接続に移動し、作成した変数ライブラリにリンクします。
手順 3: 各ワークスペースで異なる接続値をアクティブにする
開発ワークスペースからコピー ジョブをデプロイしてテストまたは運用した後、ワークスペースごとに適切な値セットを選択することで、異なる接続 ID をアクティブ化できます。
ターゲット ワークスペースに移動し、変数ライブラリを開きます。
変数ライブラリ内のそのワークスペースの対応する接続 ID をアクティブにします。
既知の制限事項
Microsoft Fabric の Data Factory でコピー ジョブに CI/CD を使用する場合の現在の制限事項を次に示します。
- ワークスペース変数: CI/CD では現在、ワークスペース変数はサポートされていません。
- Git 統合のサポートの制限: 現時点で Fabric でサポートされているのは、Azure DevOps と GitHub を使用した Git 統合だけです。 GitHub による Git 統合にはより多くの制限が存在するため、Azure DevOps による Git 統合が推奨されます。