이 문서에서는 복원력 있는 Azure 로컬 배포에 기여하는 주요 인프라 요소와 하드웨어 오류, 네트워크 중단 및 사이트 수준 재해 발생 시 연속성을 지원하는 방법을 살펴봅니다.
인프라 복원력은 Azure 로컬 배포를 위한 강력한 재해 복구 전략의 기초입니다. VM(가상 머신) 및 애플리케이션을 보호하려면 먼저 오류 및 중단을 견딜 수 있도록 기본 물리적 및 논리적 인프라를 설계해야 합니다. 여기에는 유효성이 검사된 하드웨어 선택, 고성능 스토리지 구현, 중복 네트워크 토폴로지 디자인, 복원력 있는 운영 체제 구성 요소 구성 등이 포함됩니다. Azure 로컬이 Azure 클라우드 서비스와 온-프레미스 인프라를 연결하는 하이브리드 환경에서 인프라 스택의 각 계층이 복원력을 유지하는 것은 가동 시간을 유지 관리하고 데이터를 보호하며 원활한 복구를 가능하게 하는 데 매우 중요합니다.
Hardware
Azure 로컬 인스턴스 배포의 복원력은 물리적 하드웨어에서 시작합니다. 테스트 및 인증된 하드웨어에서 Azure Local을 실행하여 중요한 워크로드에 대한 안정성, 호환성, 최적 성능 및 지원 가능성을 보장하는 것이 중요합니다. 따라서 Azure Local은 특정 OEM 하드웨어 파트너에서 사용할 수 있는 유효성이 검사된 하드웨어에만 설치할 수 있습니다.
유효성이 검사된 노드, 통합 시스템 또는 프리미어 솔루션을 비롯한 다양한 하드웨어 범주 중에서 선택할 수 있습니다. Azure Local용 프리미어 솔루션은 하드웨어 파트너와의 광범위한 협업을 통해 개발된 턴키 솔루션을 나타내며, 최고 수준의 통합 및 유효성 검사를 보장합니다. 사용 가능한 모든 플랫폼 및 솔루션 범주는 Azure 로컬 카탈로그를 참조하세요.
장애 조치(failover) 클러스터링
Windows Server 장애 조치(failover) 클러스터링은 Azure Local에 대한 고가용성 기술의 핵심 구성 요소로, VM의 복원력 및 장애 조치(failover)를 위한 프레임워크를 제공합니다. Azure 로컬 인스턴스는 장애 조치(failover) 클러스터에 구성된 여러 실제 노드로 구성될 수 있습니다. 하나 이상의 서버 노드가 장애를 일으키면 해당 역할(VM, 스토리지, 네트워크 등)이 클러스터 내의 다른 노드로 자동으로 페일오버됩니다. 즉, 워크로드는 시스템 및 최종 사용자에 대한 중단을 최소화하면서 남은 노드에서 계속 실행됩니다. 클러스터의 노드 수는 복원력 및 구현할 수 있는 스토리지 내결함성 유형에 직접적인 영향을 줍니다.
스토리지 아키텍처를 디자인할 때는 조직의 특정 공간/비즈니스 연속성 요구 사항 및 클러스터에 있는 노드 수에 맞게 스토리지 내결함성 구성을 선택하여 불필요한 오버헤드 없이 최적의 보호를 보장하는 것이 중요합니다.
자세한 내용은 Azure Local에 대한 클러스터 디자인 선택을 참조하세요.
Storage
Azure 로컬 배포를 뒷받침하는 스토리지를 고려할 때 디스크 기술 선택은 전반적인 성능 및 복원력에 중요한 역할을 합니다. SSD(반도체 드라이브), 특히 엔터프라이즈급 모델은 최신 Azure 로컬 인스턴스의 기본 표준으로, 기존의 회전 디스크에 비해 빠른 입력/출력 작업과 짧은 대기 시간을 제공합니다. 고유한 속도는 일반적인 워크로드 응답성과 재해 복구 전략에 필수적인 백업 및 복제 작업의 완료를 모두 가속화합니다.
성능 향상을 원하는 조직의 경우 NVMe(Nonvolatile Memory Express) 드라이브는 고급 옵션을 나타냅니다. NVMe 디스크는 PCIe 버스를 통해 직접 연결하여 레거시 스토리지 프로토콜을 우회하고 탁월한 처리량과 짧은 대기 시간을 제공합니다. 이는 SQL 데이터베이스, 가상 데스크톱 인프라 및 분석 작업에서 볼 수 있듯이 트랜잭션 요구 사항이 많거나 빈도가 높은 데이터 액세스 권한이 있는 워크로드에 유용합니다.
자세한 내용은 Azure Local용 실제 디스크 드라이브를 참조하세요.
스토리지 공간 다이렉트
Azure Local은 장애 조치(failover) 클러스터링과 통합하여 소프트웨어 정의 스토리지에 Storage Spaces Direct를 사용합니다. Azure 로컬 인스턴스는 적절한 스토리지 공간 다이렉트 복원력(예: 3방향 미러링 또는 이중 패리티)을 사용하여 데이터를 손실하거나 가동 중지 시간을 발생시키지 않고 두 개의 장애 도메인(노드)에서 디스크 오류 또는 노드 오류를 유지할 수 있습니다. 스토리지 공간 다이렉트 내에 SSD 또는 NVMe 드라이브를 통합하면 성능이 향상될 뿐만 아니라 스토리지 하위 시스템의 내결함성이 향상됩니다. 이러한 최신 디스크 기술의 속도와 안정성을 스토리지 공간 다이렉트의 미러링 또는 패리티 기반 복원력 체계와 결합하여 Azure 로컬 배포는 여러 드라이브 또는 노드 오류를 유지하면서 중요 업무용 워크로드에 대한 고가용성 및 일관된 성능을 제공할 수 있습니다.
자세한 내용은 스토리지 공간 다이렉트 개요를 참조하세요.
네트워크
Azure Local에는 특정 네트워크 요구 사항이 있습니다. 각 서버 노드 간의 안정적이고 높은 대역폭 및 짧은 대기 시간 네트워크 연결은 안정적인 작업을 위한 필수 필수 구성 요소입니다. 또한 각 노드에는 여러 NIC(네트워크 어댑터)가 있어야 하며 중복성 및 성능을 위해 각 네트워크 역할(스토리지, 관리, VM 트래픽)에 대해 여러 스위치에 연결하는 것이 좋습니다. 네트워크 스위치 또는 네트워크 어댑터 포트(단일 실패 지점 제거)가 실패할 경우 클러스터가 계속 작동하도록 하려면 중복 물리적 및 논리적 네트워크 토폴로지 기능을 제공하는 디자인을 구현해야 합니다.
자세한 내용은 Azure Local에 대한 네트워크 디자인을 참조하세요.
논리적 네트워크
Azure 로컬에서 논리 네트워크는 가상 머신에 대한 VLAN 기반 네트워크를 만들고 관리하는 데 사용되므로 효과적인 네트워크 구분 및 정책 애플리케이션이 가능합니다. 함수 및 신뢰 수준별로 워크로드를 분할하면 보안 경계를 적용하고 복구 계획을 간소화할 수 있습니다. 이 구조를 사용하면 중단 중에 중요한 시스템을 격리하고 우선 순위를 지정하여 연속성을 개선하고 위험을 줄일 수 있습니다.
자세한 내용은 Azure Local에 대한 논리 네트워크 토폴로지입니다.
다음 단계
- 가상 머신 복원력에 대해 자세히 알아봅니다.