次の方法で共有


信頼性の設計レビュー チェックリスト

このチェックリストでは、アーキテクチャ設計の信頼性、回復性、および障害復旧戦略を評価するために使用する一連の推奨事項を示します。 信頼性を確保するには、ワークロードに最適なインフラストラクチャとアプリケーション設計を特定します。 可用性と回復可能性のターゲット メトリックにマップされているビジネス要件に基づいて、これらの決定を行います。

信頼性の高い設計を実装するには、設計の意思決定ポイントを十分に検討し、それらの決定がワークロードに与える影響に注意してください。 このチェックリストとそれに付随するガイドは、これらの決定を行う際に役立つリソースを提供します。 ワークロードの設計、開発、運用のライフサイクル全体を通して、ワークロードの信頼性を一元的に考慮します。

チェックリスト

信頼性に重点を置いて設計に取り組み、回復性、管理性、反復性に優れたワークロードを設計できるようにします。 信頼性プラクティスを含めず、トレードオフを検討すると、設計が危険にさらされる可能性があります。 チェックリストで説明されているすべての点を慎重に検討して、システムの成功に自信を持たわせてください。

  コード 勧告
RE:01 シンプルさと効率性に重点を置いてワークロード設計を行います。 ビジネスの目標と要件を満たしながら、不必要な複雑さを回避するには、実用的なアプローチを使用します。
RE:02 ユーザー フローとシステム フローを特定して評価します。 ビジネス要件に基づいて重要度のスケールを使用して、フローに優先順位を付けます。
RE:03 障害モード分析 (FMA) を使用して、ワークロード内の潜在的な障害を特定します。 依存関係と障害ポイントを特定し、それらの障害に対する軽減戦略を策定します。
RE:04 ワークロードの信頼性と復旧のターゲットを定義します。 ターゲットを使用して、設計を通知し、正常性モデルの基礎として使用します。
RE:05
RE:05
RE:05
信頼性の目標を満たすために、特に重要なフローの場合は、さまざまなレベルで冗長性を追加します。 コンピューティングやネットワークなどの冗長インフラストラクチャ コンポーネントと、ソリューションの複数のインスタンスを検討してください。
RE:06 アプリケーション、データ、インフラストラクチャ のレベルで、タイムリーで信頼性の高いスケーリング戦略を実装します。 実際の使用パターンまたは予測される使用パターンに基づいてスケーリング戦略を立て、手動による介入を最小限に抑えます。
RE:07 自己保存と自己復旧の手段を実装することで、ワークロードの回復性を強化します。 組み込みの機能と確立されたクラウド パターンを使用して、インシデント中のワークロードの機能とインシデントからの復旧を支援します。
RE:08 カオス エンジニアリングの原則を適用して、回復性と可用性のシナリオをテストします。 アクティブな誤動作とシミュレートされたロード テストを実行して、グレースフルデ低下の実装とスケーリング戦略が効果的であることを確認します。
RE:09 復旧ターゲットに合わせて、構造化、テスト、文書化されたビジネス継続性とディザスター リカバリー (BCDR) 計画を実装します。 プランは、すべてのコンポーネントとシステム全体をカバーする必要があります。
RE:10 ソリューションの正常性シグナルを測定してモデル化します。 ワークロード全体、また個々のコンポーネントや主要なフローから、稼働時間やその他の信頼性データを継続的にキャプチャします。

次のステップ

信頼性のトレードオフを確認して、他の概念を確認することをお勧めします。