フェールオーバーとフェールオーバーモード (AlwaysOn 可用性グループ)

2025-06-16

適用対象:SQL Server

この記事では、SQL Server Always On 可用性グループのフェールオーバーおよびフェールオーバーモードについて説明します。

概要

一般的に、可用性グループのコンテキスト内で、可用性レプリカのプライマリロールとセカンダリロールが フェールオーバーと呼ばれるプロセスで交換されることがあります。フェールオーバーには、自動フェールオーバー (データ損失なし)、計画的な手動フェールオーバー (データ損失なし)、および " 強制フェールオーバー" と通常呼ばれる強制手動フェールオーバー (データ損失の可能性あり) の 3 つの形式があります。自動フェールオーバーと計画的な手動フェールオーバーの両方で、すべてのデータが保持されます。可用性グループは、可用性レプリカのレベルでフェールオーバーします。つまり、可用性グループはセカンダリレプリカのいずれか (現在の " フェールオーバーターゲット") にフェールオーバーされます。

注

データベースレベルの正常性検出が構成されていない限り、データベースレベルの問題 (データファイルの損失、データベースの削除、トランザクションログの破損によるデータベースの疑いなど) は、可用性グループのフェールオーバーを引き起こしません。

フェールオーバーによってフェールオーバーターゲットがプライマリロールを引き継ぎ、そのデータベースを復旧し、新しいプライマリデータベースとしてオンラインにします。元のプライマリレプリカは使用可能になるとセカンダリロールに切り替わり、そのデータベースがセカンダリデータベースになります。場合によっては、複数のエラーに対する対応として、または管理目的のために、これらのロールを何度も交代できます (または、別のフェールオーバーターゲットに切り替えることができます)。

特定の可用性レプリカがサポートするフェールオーバーの形式は、 フェールオーバーモード プロパティによって指定されます。特定の可用性レプリカの場合、可能なフェールオーバーモードは、次のようにレプリカの可用性モードによって異なります。

同期コミットレプリカ: 自動と手動の 2 つの設定をサポートします。 "自動" 設定では、自動フェールオーバーと手動フェールオーバーの両方をサポートしています。データの損失を回避するために、自動フェールオーバーおよび計画的なフェールオーバーでは、フェールオーバーターゲットが正常な同期状態を持つセカンダリレプリカを同期コミットします (これは、フェールオーバーターゲット上のすべてのセカンダリデータベースが対応するプライマリデータベースと同期されることを表します)。セカンダリレプリカは、これらの両方の条件を満たさない場合は常に、強制フェールオーバーのみをサポートします。強制フェールオーバーは、RESOLVING 状態のレプリカでもサポートされます。
非同期コミットレプリカ: 手動フェールオーバーモードのみをサポートします。さらに、同期されないため、強制フェールオーバーのみがサポートされます。

注

フェールオーバー後、プライマリデータベースにアクセスする必要があるクライアントアプリケーションは、新しいプライマリレプリカに接続する必要があります。また、新しいセカンダリレプリカが読み取り専用アクセスを許可するように構成されている場合は、読み取り専用クライアントアプリケーションから接続できます。可用性グループリスナーの詳細については、「可用性グループリスナー、クライアント接続、およびアプリケーションのフェールオーバー (SQL Server)」をご覧ください。

SQL Server 2025 の変更

SQL Server 2025 では、次の変更が導入されています。

永続的なシステムの健全性の問題に対する迅速なフェールオーバー

Always On 可用性グループ環境では、Windows フェールオーバークラスター (WSFC) によって可用性グループとそのレプリカの正常性が監視されます。プライマリレプリカで正常性の問題が検出されると、WSFC によって一連の修正アクションがトリガーされます。既定では、WSFC は現在のレプリカの可用性グループリソースを再起動します。 WSFC がリソースをオンラインに戻すことができない場合、WSFC は可用性グループリソースを別のレプリカにフェールオーバーします。この一連の修正アクションは一時的な障害に対して有効ですが、一時的でない障害のフェールオーバーの遅延につながる可能性があります。

WSFC フェールオーバーの動作は、 RestartThreshold 値によって制御されます。既定では、Always On 可用性グループの RestartThreshold は 1 に設定されています。つまり、WSFC はフェールオーバー前に現在のノードでリソースの再起動を試みます。

SQL Server 2025 (17.x) プレビュー以降では、Always On 可用性グループの RestartThreshold を 0 に設定できます。これは、永続的な正常性の問題が検出されるとすぐに WSFC に可用性グループリソースをフェールオーバーするように指示します。これは、ダウンタイムを最小限に抑え、可用性グループが正常なレプリカで常に使用できるようにするシナリオに役立ちます。

明らかなトレードオフがあります。

RestartThresholdを 1 に設定すると、可用性グループは一時的な障害に対する耐性が高まり、オンラインに戻る時間が短縮されます。ただし、永続的な障害の場合、フェールオーバーとダウンタイムが長くなる可能性があります。
RestartThresholdを 0 に設定すると、可用性グループは一時的な障害に対する耐性が低くなり、不必要にフェールオーバーする可能性があります。ただし、永続的な障害の場合、フェールオーバーとダウンタイムが短くなる可能性があります。

フェールオーバークラスターマネージャーまたは PowerShell を使用して、Always On 可用性グループリソースの RestartThreshold を設定できます。

たとえば、RestartThresholdという名前の可用性グループのag1を 0 に設定するには、次のコマンドを使用します。

(Get-ClusterResource -Name "ag1").RestartThreshold = 0

次のコマンドを実行して、現在の RestartThreshold 設定を確認できます。

Get-ClusterResource -Name "ag1" | Format-List *

非同期ページ要求ディスパッチの改善

可用性グループがフェールオーバーすると、各レプリカは同期先の共通の復旧ポイントを見つける必要があります。復旧ポイントは可用性グループを安定に保ち、変更を引き続き転送できるようにします。 やり直しは 、この同期プロセスの一部です。やり直しは、セカンダリレプリカが共通の復旧ポイントに到達するためにトランザクションを 元に戻 す必要がある場合に発生します。やり直しは、 FAILOVER_ALLOW_DATA_LOSSを使用した非同期レプリカへのディザスターリカバリー (DR) フェールオーバー中に最も一般的です。

DR フェールオーバーが発生した場合、セカンダリレプリカがプライマリに移行すると、新しいプライマリに元のプライマリ (新しいセカンダリ) からのネットワーク待機時間が発生し、新しいセカンダリでのやり直しが遅くなります。

このシナリオでやり直しの取り消しを改善するために、SQL Server 2025 (17.x) プレビューでは同期メカニズムの更新プログラムが導入され、可用性グループがページ要求を非同期的かつバッチで実行できるようになりました。

次の点を考慮してください。

同期メカニズムの改善は、既定で有効になっています。改善を無効にして既定の動作に戻すには、現在セカンダリまたは将来セカンダリになる可能性がある可用性グループ内のすべてのレプリカでトレースフラグ 12348 を有効にします。
AG レプリカにネットワーク待機時間がない場合、この改善によってやり直しの取り消しが改善されない可能性があります。

データベースが障害発生後の状態の解決に切り替える

まれに、可用性グループの 1 つ以上のデータベースは、一時的なネットワーク切断やクラスターノードの再起動の大部分など、一時的な WSFC クォーラム損失のために可用性グループが短時間オフラインになった後も 、同期されていない 状態のままになることがあります。 SQL Server 2025 (17.x) プレビューで導入された可用性グループ回復ロジックの更新により、この種類のクラスタークォーラム損失に対する内部許容度が強化され、可用性グループが再びオンラインに戻った後に可用性グループデータベースが Not Synchronizing 状態で停止するのを防ぐことができます。

用語と定義

自動フェールオーバー
プライマリレプリカの喪失によって自動的に発生するフェールオーバー。自動フェールオーバーは、現在のプライマリレプリカと 1 つのセカンダリレプリカのフェールオーバーモードがどちらも AUTOMATIC に設定され、セカンダリレプリカが現在同期されている場合のみサポートされます。プライマリレプリカまたはセカンダリレプリカのフェールオーバーモードが MANUAL の場合、自動フェールオーバーは実行できません。

計画的な手動フェールオーバー (データ損失なし)
計画的な手動フェールオーバーまたは " 手動フェールオーバー" は、一般的に管理目的でデータベース管理者によって開始されるフェールオーバーです。計画的な手動フェールオーバーは、プライマリレプリカとセカンダリレプリカの両方に同期コミットモードが構成され、プライマリレプリカとセカンダリレプリカがどちらも現在同期されている (SYNCHRONIZED 状態になっている) 場合にのみサポートされます。対象のセカンダリレプリカが同期されているときは、セカンダリデータベースでフェールオーバーの準備が整っているため、プライマリレプリカがクラッシュした場合でも手動フェールオーバー (データ損失なし) を実行できます。データベース管理者は手動フェールオーバーを手動で開始します。

強制フェールオーバー (データ損失の可能性あり)
セカンダリレプリカがプライマリレプリカと SYNCHRONIZED されていないか、プライマリレプリカが実行されておらず、セカンダリレプリカがフェールオーバーの準備ができていない場合に、データベース管理者が開始できるフェールオーバー。強制フェールオーバーはデータを損失する可能性があるため、ディザスターリカバリーにのみ使用することをお勧めします。強制フェールオーバーは、手動のみで開始できるため、強制手動フェールオーバーとも呼ばれます。これは、非同期コミット可用性モードでサポートされているフェールオーバーの唯一の形式です。

自動フェールオーバーセット

指定された可用性グループ内で、自動フェールオーバーが指定された同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 可用性レプリカのペア。自動フェールオーバーセットは、セカンダリレプリカがプライマリレプリカとの間で現在 SYNCHRONIZED 状態にある場合のみ有効です。

同期コミットフェールオーバーセット

指定された可用性グループ内で、同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 2 つまたは 3 つの可用性レプリカのセット。同期コミットフェールオーバーセットは、セカンダリレプリカに手動フェールオーバーモードが構成され、1 つ以上のセカンダリレプリカとプライマリレプリカが現在 SYNCHRONIZED 状態にある場合のみ有効です。

全フェールオーバーセット

指定された可用性グループ内で、可用性モードおよびフェールオーバーモードに関係なく、現在の操作状態が ONLINE であるすべての可用性レプリカのセット。全フェールオーバーセットは、現在プライマリレプリカと SYNCHRONIZED 状態になっているセカンダリレプリカがない場合に有効です。

フェールオーバーの概要

次の表に、各種の可用性モードおよびフェールオーバーモードでサポートされるフェールオーバーの形式をまとめます。ペアリングごとに、有効な可用性モードとフェールオーバーモードは、プライマリレプリカのモードと 1 つ以上のセカンダリレプリカのモードの積集合によって決まります。

フェールオーバーの形式	非同期コミットモード	手動フェールオーバーモードを指定した同期コミットモード	自動フェールオーバーを指定した同期コミットモード
自動フェールオーバー	いいえ	いいえ	はい
計画的な手動フェールオーバー	いいえ	はい	はい
強制フェールオーバー	はい	はい	はい¹

¹ 同期されたセカンダリレプリカで強制フェールオーバーコマンドを発行した場合、セカンダリレプリカの動作は手動フェールオーバーの場合と同じです。

フェールオーバー中にデータベースが使用できなくなる時間の長さは、フェールオーバーの種類および原因によって異なります。

重要

フェールオーバー後もクライアント接続をサポートするには、これまでのすべてのプライマリデータベースで定義されたログインおよびジョブを新しいプライマリデータベースに手動で再作成する必要があります (ただし、包含データベースは例外)。詳しくは、「可用性グループのデータベースのためのログインとジョブの管理 (SQL Server)」をご覧ください。

フェールオーバーセット

特定の可用性グループで可能なフェールオーバーの形式は、フェールオーバーセットの観点から理解できます。フェールオーバーセットは、次のようにフェールオーバーの特定の形式をサポートするプライマリレプリカとセカンダリレプリカで構成されています。

自動フェールオーバーセット (省略可能): 指定された可用性グループ内で、自動フェールオーバーが指定された同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 可用性レプリカのペア。自動フェールオーバーセットは、セカンダリレプリカがプライマリレプリカとの間で現在 SYNCHRONIZED 状態にある場合のみ有効です。
同期コミットフェールオーバーセット (省略可能): 指定された可用性グループ内で、同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 2 つまたは 3 つの可用性レプリカのセット。同期コミットフェールオーバーセットは、セカンダリレプリカに手動フェールオーバーモードが構成され、1 つ以上のセカンダリレプリカとプライマリレプリカが現在 SYNCHRONIZED 状態にある場合のみ有効です。
全フェールオーバーセット: 指定された可用性グループ内で、可用性モードおよびフェールオーバーモードに関係なく、現在の操作状態が ONLINE であるすべての可用性レプリカのセット。全フェールオーバーセットは、現在プライマリレプリカと SYNCHRONIZED 状態になっているセカンダリレプリカがない場合に有効です。

可用性レプリカに、自動フェールオーバーが指定された同期コミットモードを構成した場合、可用性レプリカは自動フェールオーバーセットの一部になります。ただし、セットが有効になるかどうかは、現在のプライマリに依存します。指定された時刻に実際に可能なフェールオーバーの形式は、現在有効なフェールオーバーセットによって決まります。

たとえば、次に示す 4 つの可用性レプリカを持つ可用性グループについて考えてみましょう。

[レプリカ]	可用性モードとフェールオーバーモードの設定
ある	同期コミットモードで自動フェールオーバーを指定
B	同期コミットモードで自動フェールオーバーを指定
貸方	同期コミットモードで計画的な手動フェールオーバーのみを指定
D	非同期コミットモード (強制フェールオーバーのみを指定)

各セカンダリレプリカのフェールオーバーの動作は、現在どの可用性レプリカがプライマリレプリカであるかによって異なります。基本的には、特定のセカンダリレプリカにおけるフェールオーバーの動作は、現在のプライマリレプリカに想定される最悪のケースに対応します。次の図は、セカンダリレプリカのフェールオーバー動作が現在のプライマリレプリカによってどのように異なるか、および非同期コミットモード (強制フェールオーバーのみ) または同期コミットモード (自動フェールオーバーありまたは自動フェールオーバーなし) のどちらで構成されているかを示しています。

プライマリレプリカ構成がフェールオーバーに与える影響

自動フェールオーバー

自動フェールオーバーでは、プライマリレプリカが使用できなくなった後で、対応するセカンダリレプリカが自動的にプライマリロールに移行します。セカンダリレプリカをホストするノードに対して、プライマリレプリカをホストする WSFC ノードがローカルである場合、自動フェールオーバーが最適です。これには、データ同期はコンピューター間のメッセージ待機時間が短いときに最も効果的であること、およびクライアント接続をローカルに保持できるという理由があります。

このセクションの内容

自動フェールオーバーに必要な条件
自動フェールオーバーの動作
自動フェールオーバーを有効にするには

自動フェールオーバーに必要な条件

自動フェールオーバーは、以下の条件が満たされた場合のみ発生します。

自動フェールオーバーセットが存在する。このセットはプライマリレプリカとセカンダリレプリカ (" 自動フェールオーバーターゲット") で構成され、プライマリレプリカとセカンダリレプリカは両方とも同期コミットモードで構成され、どちらも AUTOMATIC フェールオーバーに設定されています。プライマリレプリカが MANUAL フェールオーバーに設定されている場合、セカンダリレプリカが AUTOMATIC フェールオーバーに設定されている場合でも、自動フェールオーバーは実行できません。

詳細については、「可用性モード (Always On 可用性グループ)」を参照してください。
自動フェールオーバーターゲットの同期状態が正常である (これは、フェールオーバーターゲットのすべてのセカンダリデータベースが、対応するプライマリデータベースと同期されていることを意味します)。

ヒント

AlwaysOn 可用性グループでは、自動フェールオーバーセットの両方のレプリカの状態を監視します。いずれかのレプリカが失敗した場合、可用性グループの正常性状態が CRITICAL に設定されます。セカンダリレプリカが失敗した場合、自動フェールオーバーターゲットが使用できないため、自動フェールオーバーは実行できません。プライマリレプリカが失敗した場合、可用性グループはセカンダリレプリカにフェールオーバーします。元のプライマリレプリカがオンラインになるまで、自動フェールオーバーターゲットは存在しません。どちらの場合でも、可用性を確保し、連続して失敗する可能性が低くなるように、別のセカンダリレプリカを自動フェールオーバーターゲットとして構成することをお勧めします。

詳細については、「Always On ポリシーを使用した可用性グループの正常性の確認 (SQL Server)」と「可用性レプリカのフェールオーバーモードの変更 (SQL Server)」を参照してください。
Windows Server フェールオーバークラスタリング (WSFC) クラスターにクォーラムがある。詳細については、「 WSFC クォーラムモードと投票の構成 (SQL Server)」をご覧ください。
プライマリレプリカが使用できなくなり、フレキシブルフェールオーバーポリシーで定義されているフェールオーバー条件レベルが満たされました。フェールオーバー条件レベルの詳細については、「可用性グループの自動フェールオーバーのための柔軟なフェールオーバーポリシー (SQL Server)」を参照してください。

自動フェールオーバーの動作

自動フェールオーバーにより、次の一連の操作が開始されます。

現在のプライマリレプリカをホストするサーバーインスタンスがまだ実行中の場合は、プライマリデータベースの状態が DISCONNECTED に変更され、すべてのクライアントが切断されます。
対象のセカンダリレプリカの復旧キューで待機中のログレコードがある場合、セカンダリレプリカはそのログレコードを適用してセカンダリデータベースのロールフォワードを終了します。

注

特定のデータベースにログを適用するために必要な時間は、システムの処理速度、直近の作業負荷、および復旧キュー内のログの量によって異なります。
元のセカンダリレプリカはプライマリロールに移行します。そのデータベースがプライマリデータベースになります。新しいプライマリレプリカによって、コミットされていないすべてのトランザクションが迅速にロールバックされます (復旧の元に戻すフェーズ)。これらのコミットされていないトランザクションがロックによって分離されるため、クライアントがデータベースを使用している間にバックグラウンドでロールバックを行うことができます。このプロセスでは、コミット済みのトランザクションはロールバックされません。

特定のセカンダリデータベースが接続されるまでは、一時的にNOT_SYNCHRONIZEDとしてマークされます。ロールバックの復旧が開始される前、セカンダリデータベースは、新しいプライマリデータベースに接続し、即座に SYNCHRONIZED 状態に移行できます。一番問題のないケースは、フェールオーバー後もセカンダリロールを維持する 3 番目の同期コミットレプリカです。
元のプライマリレプリカをホストしているサーバーインスタンスが後で再起動されると、別の可用性レプリカが新たにプライマリロールを所有していることが認識されます。元のプライマリレプリカはセカンダリロールに移行し、そのデータベースがセカンダリデータベースになります。新しいセカンダリレプリカは現在のプライマリレプリカに接続し、可能な限り早期にそのデータベースを現在のプライマリデータベースに同期します。新しいセカンダリレプリカのデータベースの再同期が完了すると、その時点から、反対方向のフェールオーバーを実行できるようになります。

自動フェールオーバーを設定するには

任意の時点で、可用性レプリカが自動フェールオーバーをサポートするように構成できます。

自動フェールオーバーを設定するには

セカンダリレプリカが、同期コミット可用性モードを使用するように構成されていることを確認します。詳細については、「可用性レプリカの可用性モードの変更 (SQL Server)」を参照してください。
フェールオーバーモードを自動に設定します。詳細については、「可用性レプリカのフェールオーバーモードの変更 (SQL Server)」を参照してください。
必要に応じて、可用性グループの柔軟なフェールオーバーポリシーを変更して、自動フェールオーバーを発生させる障害の種類を指定します。詳細については、「自動フェールオーバーの条件を制御する柔軟なフェールオーバーポリシーの構成 (Always On 可用性グループ)」と「フェールオーバークラスターインスタンスのフェールオーバーポリシー」を参照してください。

計画的な手動フェールオーバー (データ損失なし)

対象のセカンダリレプリカがホストされているサーバーインスタンスでデータベース管理者が手動フェールオーバーコマンドを発行すると、同期済みのセカンダリレプリカがプライマリロールに移行します。手動フェールオーバーをサポートするには、セカンダリレプリカと現在のプライマリレプリカの両方に同期コミットモード (存在する場合) が構成されている必要があります。可用性レプリカのすべてのセカンダリデータベースが可用性グループに参加し、その対応するプライマリデータベースに同期されている必要があります (つまり、セカンダリレプリカを同期する必要があります)。これにより、元のプライマリデータベースでコミットされていたトランザクションもすべて新しいプライマリデータベースに確実にコミットされます。したがって、新しいプライマリデータベースは、古いプライマリデータベースと同じです。

次の図に、計画的なフェールオーバーの段階を示します。

フェールオーバーの前、プライマリレプリカは Node01のサーバーインスタンスによってホストされています。
データベース管理者によって計画的なフェールオーバーが開始されます。フェールオーバーターゲットは、 Node02のサーバーインスタンスによってホストされている可用性レプリカです。
( Node02上の) フェールオーバーターゲットが新しいプライマリレプリカになります。これは計画的なフェールオーバーであるため、フェールオーバー中に元のプライマリレプリカはセカンダリロールに切り替わり、そのデータベースをセカンダリデータベースとして即座にオンラインにします。

計画された手動フェールオーバーの図計画

このセクションの内容

手動フェールオーバーに必要な条件
手動フェールオーバーの動作
アップグレード中の可用性の維持

手動フェールオーバーに必要な条件

手動フェールオーバーをサポートするには、現在のプライマリレプリカを同期コミットモードに設定し、セカンダリレプリカを次のように設定する必要があります。

同期コミットモードが構成されている。
現在、プライマリレプリカと同期されている。

可用性グループのフェールオーバーを手動で実行するには、新しいプライマリレプリカになるセカンダリレプリカに接続する必要があります。

計画的な手動フェールオーバーの動作

計画的な手動フェールオーバーは、対象のセカンダリレプリカで開始する必要があります。計画的な手動フェールオーバーによって次の処理シーケンスが開始されます。

新しいユーザートランザクションが元のプライマリデータベースで発生しないようにするために、WSFC クラスターがプライマリレプリカをオフラインにする要求をプライマリレプリカに送信します。
セカンダリデータベースの復旧キューで待機中のログがある場合は、セカンダリレプリカで、そのセカンダリデータベースのロールフォワードが終了されます。必要な時間は、システムの処理速度、最近の作業負荷、および復旧キューのログの量によって異なります。復旧キューの現在のサイズを調べるには、 Recovery Queue パフォーマンスカウンターを使用します。詳細については、「 SQL Server、Database Replica」を参照してください。

注

復旧キューのサイズを制限することでフェールオーバーの時間を調節できます。ただし、セカンダリレプリカの遅れを取り戻すためにプライマリレプリカの処理速度が低下する場合があります。
セカンダリレプリカは新しいプライマリレプリカになり、元のプライマリレプリカは新しいセカンダリレプリカになります。
新しいプライマリレプリカは、コミットされていないトランザクションをロールバックし、そのデータベースをプライマリデータベースとしてオンラインにします。すべてのセカンダリデータベースは、新しいプライマリデータベースに接続して再同期するまで、一時的に NOT SYNCHRONIZED としてマークされます。このプロセスでは、コミット済みのトランザクションはロールバックされません。
元のプライマリレプリカはオンラインになるとセカンダリロールを引き継ぎ、元のプライマリデータベースがセカンダリデータベースになります。新しいセカンダリレプリカによって、新しいセカンダリデータベースが対応するプライマリデータベースと迅速に再同期されます。

注

新しいセカンダリレプリカのデータベースの再同期が完了すると、その時点から、反対方向のフェールオーバーを実行できるようになります。

フェールオーバー後は、クライアントから現在のプライマリデータベースに再接続する必要があります。詳細については、可用性グループリスナー、クライアント接続、およびアプリケーションのフェールオーバー (SQL Server) に関するページを参照してください。

アップグレード中の可用性の維持

可用性グループのデータベース管理者は、手動フェールオーバーを使用することにより、ハードウェアまたはソフトウェアのアップグレード時にデータベースの可用性を維持できます。ソフトウェアアップグレードのために可用性グループを使用するには、対象のセカンダリレプリカがホストされているサーバーインスタンスまたはコンピューターノードでアップグレードが受信済みである必要があります。詳細については、「 AlwaysOn 可用性グループのレプリカインスタンスのアップグレード」を参照してください。

強制フェールオーバー (データ損失の可能性あり)

可用性グループの強制フェールオーバー (データ損失の可能性あり) は、セカンダリレプリカをウォームスタンバイサーバーとして使用できるディザスターリカバリー方法です。フェールオーバーを強制するとデータが失われる可能性があるため、慎重かつ控えめに使用する必要があります。可用性データベースにサービスをすぐに復元する必要があり、データの損失を許容できる場合に限り、フェールオーバーを強制することをお勧めします。強制フェールオーバーを実行するための前提条件と推奨事項の詳細、および強制フェールオーバーを使用して重大なエラーから復旧するサンプルシナリオについては、このトピックの「可用性グループの強制手動フェールオーバーの実行 (SQL Server)」を参照してください。

警告

強制フェールオーバーでは、WSFC クラスターにクォーラムが必要です。クォーラム構成とクォーラムの強制の詳細については、「Windows Server フェールオーバークラスタリング (WSFC) と SQL Server」を参照してください。

このセクションの内容

強制フェールオーバーの動作
強制フェールオーバーのリスク
クォーラムの強制後に強制フェールオーバーが必要な理由
データ損失の可能性の追跡
データ損失の可能性への対処

強制フェールオーバーの動作

フェールオーバーを強制すると、ロールが SECONDARY 状態または RESOLVING 状態であるターゲットレプリカにプライマリロールが移行されます。フェールオーバーターゲットは、新しいプライマリレプリカになり、クライアントは直ちにデータベースのコピーを利用できるようになります。以前のプライマリレプリカが使用可能になると、セカンダリロールに移行し、そのデータベースがセカンダリデータベースになります。

すべてのセカンダリデータベース (元のプライマリデータベースが使用可能になった場合は、そのプライマリデータベースを含む) が SUSPENDED 状態になります。中断状態のセカンダリデータベースの以前のデータ同期状態に応じて、そのプライマリデータベースの損失したコミットデータを復旧することが適切な場合があります。読み取り専用アクセス用に構成されたセカンダリレプリカで、セカンダリデータベースのクエリを実行して、損失したデータを手動で検出できます。次に、新しいプライマリデータベースで Transact-SQL ステートメントを発行して、必要な変更を加えることができます。

強制フェールオーバーのリスク

フェールオーバーを強制するとデータが失われる可能性があることを理解することが不可欠です。ターゲットレプリカがプライマリレプリカと通信できないため、データ損失が発生する可能性があります。そのため、データベースが同期されることを保証できません。フェールオーバーを強制すると、新しい復旧分岐が始まります。元のプライマリデータベースとセカンダリデータベースは異なる復旧フォーク上にあるため、それぞれのデータベースには、他のデータベースに含まれていないデータが含まれるようになりました。元の各プライマリデータベースには、送信キューから以前のセカンダリデータベース (未送信ログ) にまだ送信されなかった変更が含まれています。以前のセカンダリデータベースには、フェールオーバーが強制された後に発生した変更が含まれます。

プライマリレプリカが失敗したためにフェールオーバーが強制された場合、潜在的なデータ損失は、障害が発生する前にトランザクションログがセカンダリレプリカに送信されたかどうかによって異なります。非同期コミットモードの場合、蓄積された未送信ログがある場合は常にデータ損失の可能性があります。同期コミットモードの場合、この可能性があるのは、セカンダリデータベースが同期された状態になるまでの間だけです。

次の表に、フェールオーバーを強制するレプリカ上の特定のデータベースでのデータ損失の可能性をまとめます。

セカンダリレプリカの可用性モード	データベースが同期しているか	データが失われる可能性があるか
同期コミット	はい	いいえ
同期コミット	いいえ	はい
非同期コミット	いいえ	はい

セカンダリデータベースは 2 つの復旧分岐のみを追跡するため、複数の強制フェールオーバーを実行した場合、前の強制フェールオーバーでデータの同期を開始しなかったセカンダリデータベースは再開できない場合があります。この場合、再開できないセカンダリデータベースは、可用性グループから削除し、正しい時点に復元して、可用性グループに再参加する必要があります。このシナリオでは、状態 103 のエラー 1408 が発生する可能性があります (エラー: 1408、重大度: 16、状態: 103)。復元は複数の復旧分岐に対しては機能しないため、複数の強制フェールオーバーを実行した後に必ずログバックアップを実行してください。

クォーラムの強制後に強制フェールオーバーが必要な理由

WSFC クラスターでクォーラムが強制された後 (強制クォーラム)、各可用性グループで強制フェールオーバー (データ損失の可能性あり) を実行する必要があります。強制フェールオーバーが必要なのは、WSFC クラスター値の実際の状態が失われている可能性があるためです。再構成された WSFC クラスターで同期されていないセカンダリレプリカが同期されている可能性があるため、強制クォーラム後の通常のフェールオーバーを防ぐ必要があります。

たとえば、3 つのノードで可用性グループをホストする WSFC クラスターについて考えてみます。ノード A はプライマリレプリカをホストし、ノード B とノード C はそれぞれセカンダリレプリカをホストします。ノード C は、ローカルセカンダリレプリカが SYNCHRONIZED 状態の間に WSFC クラスターから切断されます。ただし、ノード A とノード B では正常なクォーラムが保持され、可用性グループはオンラインのままになります。ノード A では、プライマリレプリカが引き続き更新を受け入れ、ノード B では、セカンダリレプリカが引き続きプライマリレプリカと同期されます。ノード C のセカンダリレプリカは同期されなくなり、プライマリレプリカからしだいに遅れが生じます。ただし、ノード C は切断されているため、レプリカは誤って SYNCHRONIZED 状態のままになります。

ノード A でクォーラムが失われた後に強制された場合は、WSFC クラスター上の可用性グループの同期の状態は正しい状態になる必要があります。つまり、ノード C のセカンダリレプリカは UNSYNCHRONIZED 状態として示される必要があります。ただし、ノード C でクォーラムが強制された場合、可用性グループの同期は正しくなくなります。クラスターの同期の状態は、ノード C が切断された時点まで戻ります。つまり、ノード C のセカンダリレプリカは誤って SYNCHRONIZED 状態として示されます。計画された手動フェールオーバーではデータの安全性が保証されるため、クォーラムが強制された後に可用性グループをオンラインに戻すことを許可されません。

データ損失の可能性の追跡

WSFC クラスターに正常なクォーラムがある場合、データベースのデータが損失する現在の可能性を推測することができます。特定のセカンダリレプリカの場合、データ損失の現在の可能性は、ローカルセカンダリデータベースが対応するプライマリデータベースにどの程度遅れているかによって決まります。遅延の程度は時間の経過と共に変化するため、非同期のセカンダリデータベースについてデータ損失の可能性を定期的に追跡することをお勧めします。遅延を追跡するには、次のように、各プライマリデータベースとそのセカンダリデータベースの最後にコミットした LSN および最終コミット時間を比較する必要があります。

プライマリレプリカに接続します。
sys.dm_hadr_database_replica_states 動的管理ビューの last_commit_lsn (最後にコミットされたトランザクションの LSN) 列および last_commit_time (最終コミット時間) 列に対してクエリを実行します。
各プライマリデータベースとその各セカンダリデータベースに返された値を比較します。最後にコミットした LSN の差異は、遅延の程度を示します。
1 つのデータベースまたは一連のデータベースでの遅延の程度が一定期間、指定した遅延の最大値を超えた場合に、警告を表示させることができます。たとえば、クエリは、各プライマリデータベースで 1 分ごとに実行されるジョブによって実行できます。プライマリデータベースとそのセカンダリデータベースの last_commit_time の差異が、最後にジョブが実行された後に目標復旧ポイント (RPO) (たとえば、5 分) を超えた場合、ジョブは警告を生成できます。

重要

WSFC クラスターにクォーラムが存在しない場合またはクォーラムが強制されている場合は、 last_commit_lsn と last_commit_time は NULL になります。クォーラム強制後のデータ損失を回避する方法の詳細については、「可用性グループの強制手動フェールオーバーの実行 (SQL Server)」を参照してください。

データ損失の可能性への対処

フェールオーバーの強制後は、すべてのセカンダリデータベースが中断されます。これには、以前のプライマリレプリカがオンラインに戻り、それが現在セカンダリレプリカであることを検出した後の、以前のプライマリデータベースが含まれます。各セカンダリレプリカで、中断されたデータベースをそれぞれ手動で再開する必要があります。

前のプライマリレプリカが使用可能になると、そのデータベースは破損していないと想定されるので、データ損失の可能性に対処できます。データ損失の可能性に対処するために使用できる方法は、元のプライマリレプリカが新しいプライマリレプリカに接続されたかどうかによって異なります。元のプライマリレプリカが新しいプライマリインスタンスにアクセスできる場合、自動的かつ透過的に再接続されます。

元のプライマリレプリカが再接続された場合

通常、障害発生後は、元のプライマリレプリカは再起動するとすぐに、パートナーに再接続します。再接続時に、元のプライマリレプリカがセカンダリレプリカになります。そのデータベースはセカンダリデータベースになり、SUSPENDED 状態になります。新しいセカンダリデータベースは、再開しない限りロールバックされません。

ただし、中断されたデータベースにはアクセスできないため、特定のデータベースを再開する場合に失われるデータを評価するためにそれらを検査することはできません。そのため、セカンダリデータベースを再開または削除するかどうかの決定は、次のように、データ損失を受け入れるかどうかによって異なります。

データの損失を許容できない場合は、データベースを可用性グループから削除して、データベースを復旧する必要があります。

データベース管理者は元のプライマリデータベースを復旧し、失われる可能性のあるデータの復旧を試みることができるようになります。ただし、以前のプライマリデータベースがオンラインになると、現在のプライマリデータベースとは異なるので、データベース管理者は、削除されたデータベースまたは現在のプライマリデータベースをクライアントにアクセスできないようにして、データベースの相違を回避し、クライアントとフェールオーバーの問題を防ぐ必要があります。
ビジネス目標を考慮してもデータの損失を許容できる場合は、セカンダリデータベースを再開できます。

新しいセカンダリデータベースを再開すると、データベース同期の最初のステップとしてこのデータベースがロールバックされます。障害発生時にログレコードが送信キューで待機していた場合、対応するトランザクションはコミットされていた場合でも失われます。

元のプライマリレプリカが再接続されていない

元のプライマリレプリカが新しいプライマリレプリカにネットワーク経由で再接続するのを一時的に防ぐことができる場合、元のプライマリデータベースを調査して、データベースが再開されたらどのデータが失われるのかを評価できます。

データ損失が許容される場合

元のプライマリレプリカから新しいプライマリレプリカへの再接続を許可します。再接続によって新しいセカンダリデータベースが中断されます。データベースのデータの同期を開始するには、単にそれを再開します。新しいセカンダリレプリカがそのデータベースの元の復旧分岐を削除し、以前のセカンダリレプリカに送信されなかったか以前のセカンダリレプリカによって受信されなかったすべてのトランザクションが失われます。
データ損失が許容されない場合

中断されたデータベースを再開したら失われる重要なデータが元のプライマリデータベースに含まれている場合、そのデータベースを可用性グループから削除することにより元のプライマリデータベース上のデータを保持できます。これにより、データベースが RESTORING 状態になります。この時点で、削除されたデータベースのログの末尾をバックアップしておくことをお勧めします。その後、復旧するデータを元のプライマリデータベースからエクスポートして、そのデータを現在のプライマリデータベースにインポートすることにより、現在のプライマリデータベース (前のセカンダリデータベース) を更新できます。更新されたプライマリデータベースの完全バックアップを、できるだけ早く実行することをお勧めします。

その後で、RESTORE WITH NORECOVERY を使用してこのバックアップ (および 1 つ以上の後続ログバックアップ) を復元することにより、新しいセカンダリレプリカをホストするサーバーインスタンスで、中断されたセカンダリデータベースを削除して新しいセカンダリデータベースを作成することができます。対応するセカンダリデータベースを再開するまで、現在のプライマリデータベースの追加のログバックアップを遅らせることをお勧めします。

警告

プライマリデータベースでは、いずれかのセカンダリデータベースが中断している間は、トランザクションログの切り捨てが遅延されます。また、ローカルデータベースが中断されている限り、同期コミットセカンダリレプリカの同期正常性を HEALTHY に移行することはできません。

フェールオーバーの動作を構成する

手動フェールオーバーを実行する

WSFC クォーラムの設定

次の方法で共有

フェールオーバーとフェールオーバー モード (AlwaysOn 可用性グループ)

概要

SQL Server 2025 の変更

永続的なシステムの健全性の問題に対する迅速なフェールオーバー

非同期ページ要求ディスパッチの改善

データベースが障害発生後の状態の解決に切り替える

用語と定義

フェールオーバーの概要

フェールオーバー セット

自動フェールオーバー

自動フェールオーバーに必要な条件

自動フェールオーバーの動作

自動フェールオーバーを設定するには

計画的な手動フェールオーバー (データ損失なし)

手動フェールオーバーに必要な条件

計画的な手動フェールオーバーの動作

アップグレード中の可用性の維持

強制フェールオーバー (データ損失の可能性あり)

強制フェールオーバーの動作

強制フェールオーバーのリスク

クォーラムの強制後に強制フェールオーバーが必要な理由

データ損失の可能性の追跡

データ損失の可能性への対処

元のプライマリ レプリカが再接続された場合

元のプライマリ レプリカが再接続されていない

関連コンテンツ

関連タスク

フィードバック

その他のリソース

フェールオーバーとフェールオーバーモード (AlwaysOn 可用性グループ)

フェールオーバーセット

元のプライマリレプリカが再接続された場合

元のプライマリレプリカが再接続されていない