Azure Data Factory と Azure Synapse Analytics のパイプラインでの BCDR

Azure Data Factory

Azure Repos

Azure Synapse Analytics

GitHub

障害には、ハードウェア障害、自然災害、またはソフトウェア障害があります。障害に備え、障害から復旧するプロセスのことを、ディザスターリカバリー (DR) と呼びます。この記事では、Azure Data Factory と Azure Synapse Analytics パイプラインのビジネス継続性とディザスターリカバリー (BCDR) を実現するための推奨されるプラクティスについて説明します。

BCDR 戦略には、可用性ゾーンの冗長性、Azure DR が提供する自動復旧、継続的インテグレーションと継続的デリバリー (CI/CD) を使用したユーザー管理の復旧が含まれます。

Architecture

このアーキテクチャの Visio ファイルをダウンロードします。

Workflow

Azure Data Factory と Azure Synapse Analytics パイプラインは、Azure リージョンと Azure 可用性ゾーンを使用して回復性を実現します。
- 各 Azure リージョンには、待ち時間で定義された境界内にデプロイされた一連のデータセンターがあります。
- Azure 可用性ゾーンは、Azure リージョン内の物理的に分離された場所です。ゾーンは、ローカル障害を許容できます。
- すべての Azure リージョンと可用性ゾーンは、専用のリージョンの低待機時間ネットワークと高パフォーマンスネットワークを介して接続されます。
- 回復性を確保するため、すべての可用性ゾーン対応リージョンには、少なくとも 3 つの個別の可用性ゾーンあります。
データセンター、データセンターの一部、またはリージョン内の可用性ゾーンで障害が発生した場合、ゾーン回復性の高い Azure Data Factory パイプラインと Azure Synapse Analytics パイプラインは、ダウンタイムをゼロにしてフェールオーバーします。

Components

Azure Data Factory は、大規模なデータワークフローの管理と自動化を支援するように設計されたクラウドベースのデータ統合サービスです。このアーキテクチャでは、データ移動と変換のワークフローを調整し、リージョンペアの自動フェールオーバーと CI/CD ベースのユーザー管理復旧による回復性をサポートします。
Azure Synapse Analytics は、大量のデータを迅速かつ効率的に分析できるように設計された、ビッグデータとデータウェアハウス用の統合プラットフォームです。
- Azure Synapse Analytics パイプラインは、Azure Synapse Analytics 内のデータ統合とオーケストレーション機能であり、データの移動と変換のためのワークフローの構築、管理、自動化に使用できます。このアーキテクチャでは、Azure Synapse Analytics パイプラインがデータワークフローを管理し、ゾーン冗長性、Git リポジトリとの統合、自動またはユーザー管理の回復アプローチを有効にすることで BCDR をサポートします。
GitHub は、開発者が Git を使用してソフトウェアプロジェクトの共同作業、コードの管理、変更の追跡を行うのに役立つクラウドベースのプラットフォームです。このアーキテクチャでは、GitHub はパイプライン成果物を格納し、ユーザーが管理する復旧戦略の一環としてセカンダリリージョンへの自動デプロイを可能にします。
Azure Repos は、コードの管理に使用できる一連のバージョン管理ツールです。このアーキテクチャでは、手動の DR とフェールオーバーの準備をサポートするために、Azure Data Factory と Azure Synapse Analytics パイプラインのソース管理と CI/CD 統合を提供することで、GitHub と同様に機能します。

Scenario details

Azure Data Factory と Azure Synapse Analytics パイプラインには、次の種類のデータを含む成果物が格納されます。

パイプライン、データセット、リンクされたサービス、統合ランタイム (XR)、トリガーなどのメタデータ
パイプラインの実行、トリガーの実行、アクティビティの実行などの監視データ

障害は、ハードウェア障害、自然事象、人為的ミスやサイバー攻撃によって引き起こされるソフトウェア障害など、さまざまな形で発生する可能性があります。障害の種類によっては、地理的な影響がリージョンまたはグローバルである可能性があります。 DR 戦略を計画するときは、災害の性質と潜在的な地理的範囲の両方を考慮してください。

Azure の BCDR は、共同責任モデルの下で動作します。 Azure には基本的なインフラストラクチャとプラットフォームサービスが用意されていますが、多くの Azure オファリングでは DR 戦略を積極的に構成する必要があります。

次の推奨プラクティスを使用して、さまざまな障害シナリオで Azure Data Factory と Azure Synapse Analytics パイプラインの BCDR を実現できます。実装については、このシナリオのデプロイを参照してください。

Azure DR を使用した自動復旧

バックアップと DR を使用して自動復旧を構成すると、リージョンがペアになっている Azure リージョンで完全な停止が発生すると、Azure Data Factory または Azure Synapse Analytics パイプラインがトリガーされ、ペアになっているリージョンに自動的にフェールオーバーされます。例外には、東南アジアとブラジルのリージョンが含まれます。データ所在地の要件では、これらのリージョンにデータを残す必要があります。

DR フェールオーバーでは、Azure Data Factory によって運用パイプラインが復旧されます。復旧したパイプラインを検証する必要がある場合は、運用パイプラインの Azure Resource Manager テンプレートをシークレットストレージにバックアップし、復旧したパイプラインとバックアップを比較できます。

Azure Global チームは定期的に BCDR の訓練を実施しており、これらの訓練には Azure Data Factory と Azure Synapse Analytics が含まれます。 BCDR の訓練では、リージョンの障害がシミュレートされ、お客様の関与なしに Azure サービスがペアになったリージョンにフェールオーバーされます。 BCDR 訓練の詳細については、サービスのテストを参照してください。

CI/CD を使用したユーザー管理の冗長性

完全なリージョン障害が発生した場合に BCDR を実現するには、セカンダリリージョンに Azure Data Factory または Azure Synapse ワークスペースがプロビジョニングされている必要があります。 Azure Data Factory または Azure Synapse Analytics パイプラインに影響を与える誤った削除、サービスの停止、または内部メンテナンスイベントが発生した場合は、Git 統合と CI/CD ワークフローを使用してパイプラインを手動で復旧できます。

必要に応じて、アクティブ/パッシブ実装を使用できます。プライマリリージョンは通常の操作を処理し、アクティブなままです。セカンダリ DR リージョンをプライマリリージョンに昇格するには、特定の実装によって異なる事前に計画された手順が必要です。これらの手順により、リージョンの障害が発生した場合にスムーズに移行し、中断を最小限に抑えることができます。この場合、インフラストラクチャに必要なすべての構成がセカンダリリージョンで使用できますが、プロビジョニングされていません。

考えられるユースケース

ユーザー管理の冗長性は、次のシナリオで役立ちます。

人為的エラーが原因でパイプライン成果物が誤って削除された
障害が報告されていないため BCDR をトリガーしない拡張停止またはメンテナンスイベント

運用ワークロードを他のリージョンにすばやく移動して、影響を受けないようにすることができます。

Considerations

これらの考慮事項では、Azure Well-Architected Framework の柱を実装します。これは、ワークロードの品質を向上させるために使用できる一連の基本原則です。詳細については、「 Well-Architected Framework」を参照してください。

Reliability

信頼性は、アプリケーションが顧客に対して行ったコミットメントを確実に満たすことができるのに役立ちます。詳細については、「信頼性の設計レビューチェックリスト」を参照してください。

Azure Data Factory と Azure Synapse Analytics パイプラインは、可用性ゾーンをサポートするメインストリームの Azure サービスです。これらは、適切なレベルの回復性と柔軟性と超低待機時間を提供するように設計されています。

ユーザーが管理する復旧アプローチを使用すると、プライマリリージョンにメンテナンスイベント、停止、または人的エラーがある場合に操作を続行できます。 CI/CD を使用すると、Azure Data Factory と Azure Synapse Analytics パイプラインを Git リポジトリに統合し、セカンダリリージョンにデプロイしてすぐに復旧できます。

Cost Optimization

コストの最適化では、不要な経費を削減し、運用効率を向上させる方法に重点を置いています。詳細については、「コストの最適化」のデザインレビューチェックリストを参照してください。

ユーザー管理の復旧では、CI/CD を使用して Azure Data Factory と Git を統合します。必要に応じて、必要なすべてのインフラストラクチャ構成をバックアップとして持つセカンダリ DR リージョンを使用します。このシナリオでは、追加コストが発生する可能性があります。コストを見積もる場合は、 Azure 料金計算ツールを使用します。

Azure Data Factory と Azure Synapse Analytics の価格の例については、次の記事を参照してください。

Operational Excellence

オペレーショナルエクセレンスは、アプリケーションをデプロイし、それを運用環境で実行し続ける運用プロセスをカバーします。詳細については、「オペレーショナルエクセレンスの設計レビューチェックリスト」を参照してください。

ユーザーが管理する CI/CD 復旧アプローチを使うと、Azure Repos または GitHub に統合できます。詳細については、「 CI/CD のベストプラクティス」を参照してください。

このシナリオのデプロイ

次のアクションを実行して、Azure Data Factory および Azure Synapse Analytics パイプライン用に自動またはユーザー管理の DR を設定します。

自動復旧を設定する

Azure Data Factory では、 IR セットアップでアクティビティの実行またはディスパッチの Azure IR リージョンを設定できます。リージョン全体の停止が発生した場合に自動フェールオーバーを有効にするには、 リージョン を [自動解決] に設定します。

IR リージョンとして [自動解決 ] を選択すると、IR はペアのリージョンに自動的にフェールオーバーされます。他の特定の場所のリージョンでは、別のリージョンにセカンダリデータファクトリを作成し、CI/CD を使用して Git リポジトリからデータファクトリをプロビジョニングできます。

マネージド仮想ネットワークの場合は、セカンダリリージョンに手動で切り替える必要があります。
Azure マネージド自動フェールオーバーは、インフラストラクチャがカスタマーマネージドであるため、セルフホステッド統合ランタイム (SHIR) には適用されません。 SHIR を使用して高可用性を実現するために複数のノードを設定する方法については、「 SHIR の作成と構成」を参照してください。
Azure SQL Server Integration Services (Azure-SSIS) IR 用に BCDR を構成するには、「 BCDR の Azure-SSIS IR を構成する」を参照してください。

リージョンの新しいネットワークで保留中のプライベートエンドポイントがあるため、フェールオーバー後にリンクされたサービスが完全に有効になりません。復旧されたリージョンでプライベートエンドポイントを構成する必要があります。承認 API を使用して、プライベートエンドポイントの作成を自動化できます。

CI/CD を使用してユーザー管理の復旧を設定する

Azure Data Factory または Azure Synapse パイプラインの削除または停止が発生した場合は、Git と CI/CD を使用してパイプラインを手動で復旧できます。

Azure Data Factory パイプライン CI/CD を使用するには、 Azure Data Factory の CI/CD と Azure Data Factory のソース管理に関するページを参照してください。
Azure Synapse Analytics パイプライン CI/CD を使用するには、 Azure Synapse Analytics ワークスペースの CI/CD に関するページを参照してください。最初にワークスペースを初期化してください。詳細については、「 Synapse Studio のソース管理」を参照してください。

CI/CD を使用してユーザー管理の冗長性をデプロイする場合は、次のアクションを実行します。

Disable triggers

元のプライマリデータファクトリがオンラインに戻った後、トリガーを無効にします。トリガーを手動で無効にするか、自動化を実装して、元のプライマリデータファクトリの可用性を定期的に確認できます。ファクトリが復旧したら直ちに、元のプライマリデータファクトリのすべてのトリガーを無効にします。

Azure PowerShell を使用して Azure Data Factory トリガーをオフまたはオンにするには、デプロイ前とデプロイ後のサンプルスクリプトと、パイプライントリガーのデプロイに関連する CI/CD の機能強化に関するページを参照してください。

重複する書き込みを処理する

ほとんどの抽出、変換、および読み込みパイプラインは、バックフィルおよび再調整プロセスで必要になるため、重複する書き込みを処理するように設計されています。透過的フェールオーバーをサポートするデータシンクでは、レコードをマージするか、特定の時間範囲内のすべてのレコードを削除して挿入することで、重複する書き込みを処理できます。

フェールオーバー後にエンドポイントを変更するデータシンクの場合、プライマリとセカンダリストレージに重複するデータまたは部分的なデータが存在する可能性があります。データを手動でマージする必要があります。

監視の仕組みを調べてパイプラインのフローを制御する (省略可能)

一般に、目的の時点から失敗したパイプラインを再開するために、失敗アクティビティやルックアップアクティビティなどのアクティビティを含むようにパイプラインを設計する必要があります。

プライマリデータファクトリの region='EastUS' やセカンダリデータファクトリの region='CentralUS' など、リージョンを示すグローバルパラメーターをデータファクトリに追加します。
3 番目のリージョンに監視の仕組みを作ります。監視の仕組みには、REST 呼び出しまたは任意の種類のストレージを使用できます。ミラーリング監視サーバーは、既定で現在のプライマリリージョン ( 'EastUS' など) を返します。
障害が発生した場合は、ミラーリング監視サーバーを手動で更新して、 'CentralUS'などの新しいプライマリリージョンを返します。
監視の仕組みを調べて現在のプライマリ値をグローバルパラメーターと比較するアクティビティを、パイプラインに追加します。
- パラメーターが一致する場合、このパイプラインはプライマリリージョンで実行されます。主な処理タスクに進みます。
- パラメーターが一致しない場合、このパイプラインはセカンダリリージョンで実行されます。結果のみを返します。

Note

この方法では、監視の仕組みへの依存関係がパイプラインに組み込まれます。監視の仕組みの読み取りに失敗すると、すべてのパイプラインの実行が停止します。

Contributors

Microsoft では、この記事を保持しています。次の共同作成者がこの記事を書きました。

Principal authors:

クリシュナクマル・ルクマンガタン |シニアプログラムマネージャー - Azure Data Factory チーム
スニル・サバート |プリンシパルプログラムマネージャー - Azure Data Factory チーム

Other contributors:

Wee Hyong Tok |PM のプリンシパルディレクター - Azure Data Factory チーム
マリオ・ツィマーマン |プリンシパルソフトウェアエンジニアリングマネージャー - Azure Data Factory チーム

公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。

次の方法で共有

Azure Data Factory と Azure Synapse Analytics のパイプラインでの BCDR

Architecture

Workflow

Components

Scenario details

Azure DR を使用した自動復旧

CI/CD を使用したユーザー管理の冗長性

考えられるユースケース

Considerations

Reliability

Cost Optimization

Operational Excellence

このシナリオのデプロイ

自動復旧を設定する

CI/CD を使用してユーザー管理の復旧を設定する

Disable triggers

重複する書き込みを処理する

監視の仕組みを調べてパイプラインのフローを制御する (省略可能)

Contributors

Next steps

次の方法で共有

Azure Data Factory と Azure Synapse Analytics のパイプラインでの BCDR

Architecture

Workflow

Components

Scenario details

Azure DR を使用した自動復旧

CI/CD を使用したユーザー管理の冗長性

考えられるユース ケース

Considerations

Reliability

Cost Optimization

Operational Excellence

このシナリオのデプロイ

自動復旧を設定する

CI/CD を使用してユーザー管理の復旧を設定する

Disable triggers

重複する書き込みを処理する

監視の仕組みを調べてパイプラインのフローを制御する (省略可能)

Contributors

Next steps

Related resources

フィードバック

考えられるユースケース