Freigeben über


Architekturstrategien für das Entwerfen für Redundanz

Gilt für diese Empfehlung der Azure Well-Architected Framework-Zuverlässigkeitsprüfliste:

RE:05 Fügen Sie Redundanz auf unterschiedlichen Ebenen hinzu, insbesondere für kritische Abläufe, um Ihre Zuverlässigkeitsziele zu erfüllen. Berücksichtigen Sie redundante Infrastrukturkomponenten wie Compute und Netzwerk sowie mehrere Instanzen Ihrer Lösung.

In diesem Leitfaden werden die Empfehlungen zum Hinzufügen von Redundanz in kritischen Flüssen auf unterschiedlichen Workloadebenen beschrieben, wodurch die Resilienz optimiert wird. Erfüllen Sie die Anforderungen Ihrer definierten Zuverlässigkeitsziele, indem Sie die richtigen Redundanzstufen auf Ihre Compute-, Daten-, Netzwerk- und anderen Infrastrukturebenen anwenden. Wenden Sie diese Redundanz an, um Ihrer Arbeitsauslastung eine starke, zuverlässige Grundlage zu geben, auf der Sie aufbauen können. Wenn Sie Ihre Workload ohne Infrastrukturredundanz erstellen, besteht aufgrund potenzieller Fehler ein hohes Risiko für längere Ausfallzeiten.

Definitionen

Begriff Definition
Redundanz Die Implementierung mehrerer identischer Instanzen einer Workloadkomponente.
Region Ein Azure-Rechenzentrumsstandort.
Polyglot-Persistenz Das Konzept der Verwendung verschiedener Speichertechnologien durch dieselbe Anwendung oder Lösung, um die besten Funktionen jeder Komponente zu nutzen.
Datenkonsistenz Das Maß für die Synchronisierung oder Synchronisierung eines bestimmten Datasets über mehrere Speicher hinweg.
Partitionierung Der Vorgang der physischen Aufteilung von Daten in separate Datenspeicher.
Scherbe Eine horizontale Datenbankpartitionierungsstrategie, die mehrere Speicherinstanzen mit einem gemeinsamen Schema unterstützt. Daten werden nicht in allen Instanzen repliziert.

Verwenden Sie im Kontext der Zuverlässigkeit Redundanz, um Probleme zu enthalten, die sich auf eine einzelne Ressource auswirken, und stellen Sie sicher, dass sich diese Probleme nicht auf die Zuverlässigkeit des gesamten Systems auswirken. Verwenden Sie die Informationen, die Sie über Ihre kritischen Flüsse und Zuverlässigkeitsziele identifiziert haben, um fundierte Entscheidungen zu treffen, die für die Redundanz der einzelnen Abläufe erforderlich sind.

Beispielsweise verfügen Sie möglicherweise über mehrere Webserverknoten, die gleichzeitig ausgeführt werden. Wenn der von ihnen unterstützten Fluss kritisch ist, benötigen alle Knoten möglicherweise Replikate, die den Datenverkehr sofort akzeptieren können, wenn sich ein Problem auf den gesamten Pool auswirkt, z. B. einen vollständigen Ausfall des Rechenzentrums. Da große Probleme selten sind und es kostspielig ist, eine ganze Reihe von Replikaten bereitzustellen, stellen Sie möglicherweise eine begrenzte Anzahl von Replikaten bereit, damit der Fluss in einem beeinträchtigten Zustand arbeitet, bis Sie das Problem beheben.

Wenn Sie redundanz im Kontext der Leistungseffizienz entwerfen, verteilen Sie die Last über mehrere redundante Knoten, um sicherzustellen, dass jeder Knoten optimal ausgeführt wird. Bauen Sie im Zusammenhang mit zuverlässigkeitsfähiger Kapazität auf, um Fehler oder Fehlfunktionen zu absorbieren, die sich auf einen oder mehrere Knoten auswirken. Stellen Sie sicher, dass die Ersatzkapazität Fehler für die gesamte Zeit aufnehmen kann, die zum Wiederherstellen der betroffenen Knoten erforderlich ist. Mit dieser Unterscheidung müssen beide Strategien zusammenarbeiten. Wenn Sie datenverkehrsübergreifend auf zwei Knoten für die Leistung verteilen und beide bei 60% Auslastung ausgeführt werden und ein Knoten fehlschlägt, besteht das Risiko, dass der verbleibende Knoten überfordert wird, da er nicht mit 120%ausgeführt werden kann. Verteilen Sie die Auslastung mit einem anderen Knoten, um sicherzustellen, dass Ihre Leistungs- und Zuverlässigkeitsziele eingehalten werden.

Trade-Offs:

  • Mehr Arbeitsauslastungsredundanz entspricht mehr Kosten. Überlegen Sie sorgfältig, Redundanz hinzuzufügen und ihre Architektur regelmäßig zu überprüfen, um sicherzustellen, dass Sie Kosten verwalten, insbesondere wenn Sie überprovisionieren. Wenn Sie die Überprovisionierung als Resilienzstrategie verwenden, wägen Sie sie mit einer gut definierten Skalierungsstrategie ab, um die Kostenineffizienzen zu minimieren.

  • Es kann Leistungsabwendungen geben, wenn Sie einen hohen Grad an Redundanz aufbauen. Beispielsweise können Ressourcen, die sich über Verfügbarkeitszonen oder Standorte verteilen, auf die Leistung auswirken, da Sie Datenverkehr über Verbindungen mit hoher Latenz zwischen redundanten Ressourcen wie Webservern oder Datenbankinstanzen senden müssen.

  • Unterschiedliche Abläufe innerhalb derselben Workload können unterschiedliche Zuverlässigkeitsanforderungen aufweisen. Flussspezifische Redundanzdesigns können die Komplexität in das Gesamtdesign einbringen.

  • Ein Redundanzentwurf mit geringer Latenz bedeutet, dass Sie das Risiko akzeptieren, dass diese Komponenten im Falle eines groß angelegten Ereignisses, z. B. einer geografischen Katastrophe, verloren gehen, die alle Instanzen offline nimmt. Eine geoferne Notfallwiederherstellungsumgebung (DR) trägt dazu bei, dieses Risiko zu minimieren, aber die Kosten zu erhöhen.

Bevorzugen Sie serverlose und vollständig verwaltete Dienste, um den Betriebsaufwand zu verringern.

Nutzen Sie serverlose, Software as a Service (SaaS) und Plattform-as-a-Service-Lösungen (PaaS), um Ihrer Workload problemlos Redundanz hinzuzufügen, ohne datenreplikations- oder Failovervorgänge verwalten zu müssen. Diese Dienste implementieren Redundanz transparent, wodurch die betriebliche Belastung beim Entwerfen und Verwalten ihrer eigenen Redundanzmechanismen aufgehoben wird. Wenn Sie Dienstoptionen auswerten, priorisieren Sie verwaltete Dienste, die Redundanz automatisch über infrastrukturbasierte Ansätze verarbeiten, die eine manuelle Redundanzkonfiguration erfordern.

Verwaltete Azure-Dienste bieten Redundanz über verschiedene Modelle. Jedes Modell bietet unterschiedliche Abstraktionsebenen und betriebliche Einfachheit.

Globale Dienste mit integrierter Redundanz: Dienste wie Microsoft Entra ID, Azure DNS und Azure Key Vault funktionieren als globale Dienste mit automatischer Redundanz in mehreren Regionen. Diese Dienste bieten inhärente Resilienz, ohne dass eine Redundanzkonfiguration von Ihnen erforderlich ist. Sie behandeln Failover- und Wiederherstellungsszenarien automatisch transparent.

Abstrahierte Kapazitätsmodelle: Angebote wie Azure Cosmos DB, Azure Databricks und von Azure OpenAI verwaltete Endpunkte abstrahiert die zugrunde liegende Infrastrukturkomplexität hinter Kapazitätseinheiten, DTUs oder anderen logischen Metriken. Diese Dienste verteilen Ihre Workload automatisch über mehrere Instanzen, Zonen und Regionen, während sie ein vereinfachtes Abrechnungs- und Verwaltungsmodell darstellen. Sie geben Kapazitätsanforderungen an, anstatt einzelne redundante Instanzen zu verwalten.

Wenn Sie Ihre Lösung entwerfen, bewerten Sie, ob für jede Komponente eine Option für verwaltete Dienste vorhanden ist, bevor Sie infrastrukturbasierte Redundanz implementieren. Verwaltete Dienste reduzieren ihren betriebstechnischen Aufwand und bieten häufig robustere Redundanzimplementierungen als benutzerdefinierte Lösungen, obwohl sie möglicherweise Kompromisse bei der Kontrolle und potenziell höhere Kosten für jede Kapazitätseinheit umfassen.

Erstellen von Redundanz in Ihrer Workload mit mehreren Komponenteninstanzen

Stellen Sie mehrere Instanzen Ihrer Infrastrukturkomponenten und -dienste bereit, um die Resilienz zu erreichen, die Ihre Workload benötigt. Diese grundlegende Redundanzstrategie stellt sicher, dass bei einem Ausfall einer Instanz weiterhin andere Instanzen die Workload verarbeiten können. Sie können mehrere Instanzen durch unterschiedliche Ansätze erreichen. In einigen Szenarien müssen Sie Redundanz manuell konfigurieren, indem Sie mehrere Ressourcen einzeln bereitstellen, z. B. mehrere Azure ExpressRoute-Schaltkreise oder das Konfigurieren von Azure Traffic Manager in mehreren Regionen. Andere Dienste sind so konzipiert, dass mehrere Instanzen direkt unterstützt werden, z. B. das Festlegen von Azure Virtual Machine Scale Sets auf fünf Instanzen oder das Konfigurieren von Azure App Service für die Ausführung von 10 Instanzen. Bevorzugen Sie nach Möglichkeit Dienste, die integrierte Unterstützung für mehrere Instanzen und automatische Skalierungsfunktionen bieten, da sie die Redundanzverwaltung vereinfachen und sowohl auf Zuverlässigkeits- als auch Leistungsanforderungen reagieren können.

Wenn Sie redundante Infrastrukturkomponenten bereitstellen, bestimmen Sie, wie viele Instanzen jeder Komponente Ihre Zuverlässigkeitsziele erfüllen. Überlegen Sie, ob Sie mehrere Instanzen aller Komponenten oder nur bestimmte kritische Komponenten benötigen, und bestimmen Sie die geografische Verteilung dieser Instanzen, um Ihre Resilienzanforderungen zu erfüllen. Berücksichtigen Sie bei der Bereitstellung redundanter Infrastruktur die folgenden Empfehlungen.

Berechnen von Ressourcen:

  • Bevorzugen Sie Dienste, die unterstützung für Redundanz integriert haben. Mit diesen Diensten können Sie die Anzahl der benötigten Instanzen angeben und die Verteilung und Verwaltung dieser Instanzen für Sie behandeln.

  • Sorgen Sie dafür, dass die Computeschicht von jedem Zustand sauber bleibt, da einzelne Knoten, die Anforderungen erfüllen, jederzeit gelöscht, fehlerhaft oder ersetzt werden können.

  • Entwerfen und testen Sie Ihre Skalierungsstrategie, um Ihren Redundanzansatz zu entsprechen.

Datenressourcen:

  • Replizieren Sie Daten in geografischen Regionen, um Ausfallsicherheit für regionale Ausfälle und katastrophale Fehler bereitzustellen.

  • Grundlegendes zu den integrierten Replikations- und Redundanzfunktionen der zustandsbehafteten Plattformdienste , die Sie verwenden.

  • Ermitteln Sie, ob die synchrone oder asynchrone Datenreplikation für die Funktionalität Ihrer Workload erforderlich ist. Weitere Informationen finden Sie unter Empfehlungen für die Verwendung von Verfügbarkeitszonen und Regionen.

  • Verteilen Sie Daten geografisch, wie von Ihrem Dienst unterstützt, um die Auswirkungen von geografisch lokalisierten Fehlern zu minimieren.

  • Automatisieren Sie das Failover nach einem Datenbankinstanzfehler. Sie können automatisiertes Failover in mehreren Azure PaaS-Datendiensten konfigurieren. Für Datenspeicher, die Schreibvorgänge mit mehreren Regionen unterstützen, wie Azure Cosmos DB, ist kein automatisiertes Failover erforderlich. Weitere Informationen finden Sie unter Empfehlungen für das Entwerfen einer DR-Strategie.

  • Verwenden Sie den besten Datenspeicher für Ihre Daten. Nutzen Sie polyglot Persistenz oder Lösungen, die eine Kombination aus Datenspeichertechnologien verwenden. Daten enthalten mehr als nur gespeicherte Anwendungsdaten. Sie umfasst auch Anwendungsprotokolle, Ereignisse, Nachrichten und Caches.

  • Berücksichtigen Sie die Anforderungen an die Datenkonsistenz, und verwenden Sie ggf. die Konsistenz , wenn anforderungen dies zulassen. Wenn Daten verteilt werden, verwenden Sie geeignete Koordination, um starke Konsistenzgarantien durchzusetzen. Die Koordination kann ihren Durchsatz reduzieren und ihre Systeme eng miteinander verkoppeln, was sie schwächer machen kann. Wenn ein Vorgang z. B. zwei Datenbanken aktualisiert, anstatt ihn in einen einzelnen Transaktionsbereich einzufügen, ist es besser, wenn das System die mögliche Konsistenz berücksichtigen kann.

  • Partitionsdaten für die Verfügbarkeit. Die Datenbankpartitionierung verbessert die Skalierbarkeit und kann auch die Verfügbarkeit verbessern. Wenn ein Shard abfällt, sind die anderen Shards immer noch erreichbar. Ein Fehler in einem Shard stört nur eine Teilmenge der gesamten Transaktionen.

  • Wenn Sharding keine Option ist, können Sie das CQRS-Muster (Command Query Responsibility Segregation) verwenden, um Ihre schreibgeschützten und schreibgeschützten Datenmodelle zu trennen. Fügen Sie redundante schreibgeschützte Datenbankinstanzen hinzu, um mehr Resilienz bereitzustellen.

Netzwerkressourcen:

  • Entscheiden Sie sich für eine zuverlässige und skalierbare Netzwerktopologie. Verwenden Sie ein Hub-and-Spoke-Modell oder ein virtuelles AZURE-WAN-Modell, um Ihre Cloudinfrastruktur in logische Muster zu organisieren, mit denen Ihr Redundanzdesign einfacher erstellt und skaliert werden kann.

  • Wählen Sie den entsprechenden Netzwerkdienst aus, um Anforderungen innerhalb oder über Regionen hinweg abzugleichen und umzuleiten. Verwenden Sie globale oder zonenredundante Lastenausgleichsdienste, wenn möglich, um Ihre Zuverlässigkeitsziele zu erfüllen.

  • Stellen Sie sicher, dass Sie ausreichenden IP-Adressraum in Ihren virtuellen Netzwerken und Subnetzen zugewiesen haben, um die geplante Nutzung zu berücksichtigen, einschließlich der Skalierungsanforderungen.

  • Stellen Sie sicher, dass die Anwendung innerhalb der Portgrenzwerte der ausgewählten Anwendungshostingplattform skaliert werden kann. Wenn eine Anwendung mehrere TCP-Verbindungen (Outbound Transmission Control Protocol) oder UDP-Verbindungen (User Datagram Protocol) initiiert, kann sie alle verfügbaren Ports ausschöpfen und zu einer schlechten Anwendungsleistung führen.

  • Wählen Sie SKUs aus, und konfigurieren Sie Netzwerkdienste, die Ihre Bandbreiten- und Verfügbarkeitsanforderungen erfüllen können. Der Durchsatz eines VPN-Gateways variiert je nach SKU. Unterstützung für Zonenredundanz ist nur für einige SKUs für den Lastenausgleich verfügbar.

  • Stellen Sie sicher, dass Ihr Design für die Behandlung von Domain Name System (DNS) mit einem Fokus auf Resilienz basiert und redundante Infrastruktur unterstützt.

Verwenden des Bereitstellungsstempelmusters zum Optimieren Ihres Redundanzansatzes

Über Redundanz für einzelne Infrastrukturkomponenten und -dienste hinaus erweitern Sie Ihre Redundanzstrategie auf die Workloadebene, indem Sie mehrere Instanzen Ihrer gesamten Workload oder logischen Ressourcengruppen bereitstellen. Befolgen Sie das Entwurfsmuster für Bereitstellungsstempel , um wiederholbare, eigenständige Einheiten zu erstellen, die alle Ressourcen enthalten, die zum Bereitstellen Ihrer Workload an eine bestimmte Teilmenge von Benutzern oder Anforderungen erforderlich sind.

Bereitstellungsstempel stellen eine Umstellung von Komponentenebene auf Redundanz auf Arbeitsauslastungsebene dar. Jeder Stempel dient als vollständige Skalierungseinheit, die alle erforderlichen Ressourcen enthält – Compute, Speicher, Netzwerk und Abhängigkeiten –, die unabhängig ausgeführt werden können. Dieser Ansatz bietet wichtige Vorteile, einschließlich isolierter Fehlerdomänen, die Strahlradius, horizontale Skalierung durch zusätzliche Stempelbereitstellung statt einzelner Komponentenskalierung, flexible Segmentierung nach Geografie oder Anforderungen und vereinfachte Vorgänge über identische wiederholbare Einheiten enthalten.

Unabhängig davon, ob Sie Stempel in einem aktiven Modell (bei dem alle Stempel aktiv Datenverkehr gleichzeitig bedienen) oder aktiv passives Modell bereitstellen (wobei ein Stempel datenverkehrsbereit bleibt, während andere im Standbymodus bleiben), entwerfen Sie jeden Stempel als vollständige, eigenständige Bereitstellung, die ihre festgelegte Arbeitsauslastung unabhängig verarbeiten kann.

Erzielen sie null Ausfallzeiten durch aktive Redundanz

Aktive Bereitstellungen maximieren die Dienstverfügbarkeit, indem mehrere Instanzen einer Workload gleichzeitig ausgeführt werden, wobei jeder Datenverkehr aktiv verarbeitet wird. Diese Einrichtung stellt ein sofortiges Failover sicher, beseitigt Ausfallzeiten und optimiert die Ressourcennutzung, indem alle Instanzen produktiv bleiben. Wenn eine Instanz fehlschlägt, wird der Datenverkehr automatisch an fehlerfreie Instanzen umgeleitet, ohne den Dienst zu unterbrechen.

Beispielsweise kann eine E-Commerce-Plattform während der Spitzensaison nahtlose Vorgänge verwalten, auch wenn bei einer Bereitstellung Probleme auftreten. Aktive Konfigurationen eignen sich ideal für unternehmenskritische Workloads, die eine unterbrechungsfreie Verfügbarkeit erfordern, weisen jedoch höhere Infrastrukturkosten und Komplexität auf. Erweiterte operative Strategien sind erforderlich, um mehrere Liveumgebungen zu verwalten, Datenkonsistenz sicherzustellen und Aktualisierungen über alle Instanzen hinweg zu koordinieren.

In den folgenden Abschnitten werden Konfigurationsoptionen für aktive Bereitstellungen beschrieben.

  • Aktiv aktiv in Kapazität: Gespiegelte Bereitstellungsstempel an zwei oder mehr Standorten, die jeweils für die Verarbeitung von Produktionsarbeitslasten für den Standort oder die Standorte konfiguriert sind, die sie bedienen und skalierbar sind, um Lasten von anderen Standorten zu verarbeiten, wenn ein regionaler Ausfall auftritt.

    • Vernetzung: Verwenden Sie Latenz oder gewichtetes globales Routing, um den Datenverkehr zwischen Standorten zu verteilen.

    • Datenreplikation und Konsistenz: Verwenden Sie einen global verteilten Datenspeicher wie Azure Cosmos DB für Lese- und Schreibfunktionen in mehreren Regionen. Verwenden Sie für relationale Datenbanken lesbare Replikate mit schreibgeschützten Verbindungszeichenfolgen.

    • Vorteil dieses Designs: Niedrigere Betriebskosten als ein überprovisioniertes Design.

    • Nachteil dieses Designs: Mögliche Beeinträchtigung der Benutzererfahrung beim Skalieren, um die Anforderungen einer vollständigen Last zu erfüllen, wenn ein anderer Standort einen Ausfall erlebt.

  • Active-active overprovisioned: Gespiegelte Bereitstellungsstempel an zwei oder mehr Standorten, die jeweils überprovisioniert wurden, um Produktionsarbeitslasten für den Standort oder die Von ihnen bedienten Standorte zu verarbeiten und Lasten von anderen Standorten zu verarbeiten, wenn ein regionaler Ausfall auftritt.

    • Vernetzung: Verwenden Sie Latenz oder gewichtetes globales Routing, um den Datenverkehr zwischen Standorten zu verteilen.

    • Datenreplikation und Konsistenz: Verwenden Sie einen global verteilten Datenspeicher wie Azure Cosmos DB für Lese- und Schreibfunktionen in mehreren Regionen. Verwenden Sie für relationale Datenbanken lesbare Replikate mit schreibgeschützten Verbindungszeichenfolgen.

    • Vorteil dieses Designs: Das widerstandsfähigste Design, das möglich ist.

    • Nachteil dieses Designs: Höhere Betriebskosten als ein skalierbares Design.

  • Häufige Vorteile beider Designs: Hohe Resilienz und geringes Risiko des Ausfalls vollständiger Arbeitsauslastung.

  • Häufige Nachteile beider Designs: Höhere Betriebskosten und Verwaltungslast aufgrund verschiedener Faktoren, einschließlich der Notwendigkeit der Verwaltung der Synchronisierung des Anwendungszustands und der Daten.

Verwenden eines passiven Architekturdesigns zur Bereitstellung von DR-Resilienz

Active-passive Bereitstellungskonfigurationen bieten eine kostengünstige Möglichkeit, dr sicherzustellen, indem eine primäre Instanz ausgeführt wird, die den gesamten Datenverkehr verarbeitet, während sekundäre Instanzen leer bleiben, aber bereit sind. Diese Standbyinstanzen werden nur aktiviert, wenn die primäre Instanz fehlschlägt oder der Wartung unterzogen wird. Bei diesem Ansatz wird die Ressourcenauslastung minimiert, während zuverlässige Failoverfunktionen bereitgestellt werden.

Beispielsweise kann eine Finanzhandelsplattform dieses Setup verwenden, um die Dienstkontinuität aufrechtzuerhalten. Das primäre System verwaltet alle Transaktionen, während das sekundäre System im Hintergrund synchronisiert bleibt. Wenn das primäre System abläuft, übernimmt das sekundäre System schnell Vorgänge mit minimalen Unterbrechungen und stellt sie wieder her. Dieser Ansatz gleicht Zuverlässigkeit und Kosten aus, was es ideal für Workloads macht, die kurze Wiederherstellungszeiten ohne komplexität oder Kosten aktiver Bereitstellungen tolerieren können.

Berücksichtigen Sie die folgenden Konfigurationsoptionen für aktiv-passive Bereitstellungen.

  • Warmer Ersatz: Ein primärer Standort und mindestens ein sekundärer Speicherort. Der sekundäre Speicherort wird mit der minimal möglichen Berechnungs- und Datengröße bereitgestellt und ohne Last ausgeführt. Dieser Ort wird als warmer Ersatzstandort bezeichnet. Nach dem Failover werden die Compute- und Datenressourcen skaliert, um die Last vom primären Speicherort zu verarbeiten.

    • Vernetzung: Verwenden Sie das globale Routing mit Priorität .

    • Datenreplikation und Konsistenz: Replizieren Sie Ihre Datenbank an Ihren passiven Speicherort, und verwenden Sie die automatischen Failoverfunktionen von PaaS-Lösungen wie Azure Cosmos DB und Azure SQL Database.

    • Vorteil dieses Designs: Kürzeste Wiederherstellungszeit bei den aktiv-passiven Designs.

    • Nachteil dieses Designs: Höchste Betriebskosten bei den aktiv-passiven Designs.

  • Kalter Ersatz: Ein primärer Standort und mindestens ein sekundärer Speicherort. Der sekundäre Speicherort wird skaliert, um die vollständige Auslastung zu verarbeiten, aber alle Computeressourcen werden beendet. Dieser Ort wird als kalter Ersatzstandort bezeichnet. Sie müssen die Ressourcen vor dem Failover starten.

    • Vernetzung: Verwenden Sie das globale Routing mit Priorität .

    • Datenreplikation und Konsistenz: Replizieren Sie Ihre Datenbank an Ihren passiven Speicherort, und verwenden Sie die automatischen Failoverfunktionen von PaaS-Lösungen wie Azure Cosmos DB und SQL-Datenbank.

    • Vorteil dieses Designs: Niedrigere Betriebskosten als das warme Ersatzdesign.

    • Nachteil dieses Designs: Längere Wiederherstellungszeit als das warme Ersatzdesign.

Verteilen von Workloads über eine unabhängige Infrastruktur

Das Bereitstellen von Arbeitslasten in unabhängigen Rechenzentren oder Rechenzentrumssektoren bietet Redundanz, ohne die Leistung zu beeinträchtigen. Durch die Verwendung geografisch geschlossener, aber physisch getrennter Einrichtungen stellt diese Einrichtung eine Fehlerisolation mit minimaler Latenzwirkung sicher. Sie bietet die Resilienz der verteilten Infrastruktur und gleichzeitig die Reaktionsfähigkeit einer Bereitstellung mit einem standortübergreifenden Standort. In Azure bieten Verfügbarkeitszonen diese Funktionalität. Verfügbarkeitszonen sind physisch unabhängige Rechenzentren oder Rechenzentrumssektoren, mit denen Sie problemlos fehlertolerante Workloads mit geringer Latenz bereitstellen können.

Bei latenzempfindlichen Anwendungen wie Echtzeitspielen ermöglicht dieser Ansatz ein nahtloses Failover und unterbrechungsfreie Benutzererfahrung. Spieleserver, die über lokale Rechenzentren verteilt werden, können während Ausfällen sofort Datenverkehr umleiten, wobei transparenter Lastenausgleich und nahezu echtzeitbasierte Datenreplikation die Spielkontinuität erhalten bleiben. Diese Strategie birgt jedoch ein gewisses Risiko, da sich große regionale Ereignisse gleichzeitig auf alle Standorte auswirken können.

Stärken der Fehlertoleranz mit geofernen Bereitstellungen

Die Bereitstellung über geografisch verteilte Rechenzentren bietet den stärksten Schutz vor groß angelegten Katastrophen, indem Workloads über Hunderte oder Tausende von Meilen verteilt werden. Dieser Ansatz stellt die Geschäftskontinuität bei Ereignissen wie Naturkatastrophen, Infrastrukturausfällen oder geopolitischen Störungen sicher, die sich auf ganze Ballungsgebiete auswirken können. In Azure können Sie Workloads in Regionen bereitstellen, die auf der ganzen Welt verteilt sind. Wenn Sie diesen Designansatz verwenden, wählen Sie Regionen aus, die ihren Benutzern nahe liegen, aber geografisch entfernt sind, z. B. west-US und Ost-USA.

Beispielsweise kann eine globale Finanzplattform unterbrechungsfreie Dienste beibehalten, indem der Datenverkehr an nicht betroffene Regionen weitergeleitet wird, wenn ein Bereich einen großen Ausfall erlebt. Dieser Ansatz maximiert Resilienz und unterstützt die Einhaltung gesetzlicher Vorschriften in allen Rechtsordnungen, führt jedoch zu einer höheren Latenz, komplexen Anforderungen an die Datenkonsistenz und erhöhtem Betriebsaufwand. Sie müssen diese Faktoren sorgfältig gegen die Vorteile globaler Redundanz abwägen.

Azure-Erleichterung

Die Azure-Plattform hilft Ihnen, die Ausfallsicherheit Ihrer Workload zu optimieren und Redundanz hinzuzufügen, indem Sie die folgenden Aktionen ausführen:

DNS-spezifische Azure-Erleichterung

  • Verwenden Sie für Szenarien mit interner Namensauflösung Azure DNS private Zonen, die integrierte Zonenredundanz und Georedundanz aufweisen. Weitere Informationen finden Sie unter Ausfallsicherheit der privaten Azure DNS-Zone.

  • Verwenden Sie für Szenarien mit externer Namensauflösung öffentliche Azure DNS-Zonen, die integrierte Zonenredundanz und Georedundanz aufweisen.

  • Die öffentlichen und privaten Azure DNS-Dienste sind globale Dienste, die für regionale Ausfälle widerstandsfähig sind, da Zonendaten global verfügbar sind.

  • Verwenden Sie für Szenarien mit hybrider Namensauflösung zwischen lokalen und Cloudumgebungen Azure DNS Private Resolver. Dieser Dienst unterstützt Zonenredundanz, wenn sich Ihre Workload in einer Region befindet, die Verfügbarkeitszonen unterstützt. Für einen zonenweiten Ausfall ist während der Zonenwiederherstellung keine Aktion erforderlich. Der Dienst heilt sich automatisch selbst und rebalancet aus, um die gesunde Zone zu nutzen. Weitere Informationen finden Sie unter Resilienz in Azure DNS Private Resolver.

  • Um einen einzelnen Fehlerpunkt zu vermeiden und eine stabilere Hybridnamenauflösung über Regionen hinweg zu erzielen, stellen Sie zwei oder mehr private Azure DNS-Resolver in verschiedenen Regionen bereit. Dns-Failover wird in einem Szenario für die bedingte Weiterleitung erreicht, indem ein Resolver als primärer DNS-Server zugewiesen wird. Weisen Sie den anderen Resolver in einer anderen Region als sekundären DNS-Server zu. Weitere Informationen finden Sie unter Einrichten eines DNS-Failovers mithilfe privater Resolver.

Example

Ein Beispiel für eine redundante bereitstellung mit mehreren Regionen finden Sie unter Baseline hochverwendbar zone-redundante Webanwendung.

Das folgende Diagramm zeigt ein weiteres Beispiel.

Diagramm, das die Architektur der Referenzimplementierung zeigt.

Weitere Informationen zur Redundanz finden Sie in den folgenden Ressourcen:

Zuverlässigkeitsprüfliste

Lesen Sie den vollständigen Satz von Empfehlungen.