프로덕션 환경에서 Azure CycleCloud를 배포하기 전에 인프라, 구성 및 운영 프로세스를 신중하게 계획해야 합니다. 이 문서에서는 성공적이고 안정적인 CycleCloud 배포를 보장하기 위한 주요 결정 및 요구 사항에 대한 지침을 제공합니다. 초기 설정, 애플리케이션 통합, 데이터 관리 및 재해 복구를 다룹니다.
Azure CycleCloud 배포
- 배포할 CycleCloud 버전을 선택합니다.
- CycleCloud 서버 배포에 대한 구독, 가상 네트워크, 서브넷 및 리소스 그룹을 선택하여 Azure 구독 준비
- 클러스터를 호스트할 리소스 그룹을 선택하거나 CycleCloud에서 리소스 그룹을 만들도록 허용(기본 설정)
- 사물함 액세스를 위한 스토리지 계정을 만듭니다
- 인증에 SSH 키, Microsoft Entra ID 또는 LDAP를 사용할지 결정
- CycleCloud에서 서비스 주체 또는 관리 ID를 사용해야 하는지 결정(단일 구독에 권장) 서비스 주체와 관리 ID 중에서 선택
- CycleCloud을 위해 사용할 SKU를 확인하세요: CycleCloud 시스템 요구 사항
- 잠긴 네트워크에 환경을 배포할지 여부를 결정합니다. 그렇다면 다음 요구 사항을 고려합니다. 잠긴 네트워크에서 작동
- CycleCloud 서버 배포
경고
스토리지 계정을 만드는 동안 Azure Data Lake Storage Gen 2에 대해 "계층 구조 네임스페이스 사용"을 설정하지 마세요. CycleCloud는 스토리지 보관으로 ADLS Gen 2를 사용하도록 설정된 Blob Storage를 사용할 수 없습니다.
Azure CycleCloud 구성
- CycleCloud 서버에 로그인하고 사이트 및 CycleCloud 관리자 계정을 만듭니다. CycleCloud 설정
- 스토리지 계정을 가리키는 CycleCloud 사물함 만들기
Azure CycleCloud 클러스터 구성
- 클러스터에 대한 사용자 액세스 정의 클러스터 사용자 관리
- 사용할 스케줄러 선택
- 스케줄러 및 헤드 노드의 버전 선택
- 컴퓨팅에 대한 버전을 선택하고 노드를 실행합니다. 이 선택은 전적으로 실행 중인 애플리케이션에 따라 달라집니다.
- 템플릿을 사용하여 클러스터를 배포할지 또는 수동으로 배포할지 결정합니다.
- 클러스터 템플릿 정의 및 사물함에 업로드: 클러스터 템플릿 참조
- 수동으로 클러스터 만들기: 새 클러스터 만들기
- 스케줄러에서 스크립트를 실행해야 하는지 또는 배포된 후에 노드를 실행해야 하는지 결정합니다.
응용 프로그램
- 애플리케이션에는 어떤 종속성(라이브러리 등)이 있나요? 이러한 종속성을 사용할 수 있도록 하려면 어떻게 해야 할까요?
- 애플리케이션을 설정하고 설치하는 데 얼마나 걸리나요? 이 요소는 실행 노드에서 애플리케이션을 사용할 수 있도록 하는 방법을 결정할 수 있습니다. 사용자 지정 이미지가 필요할 수도 있습니다.
- 고려해야 할 라이선스 종속성이 있나요? 애플리케이션이 온-프레미스 라이선스 서버에 연결해야 합니까?
- 애플리케이션은 어디에서 실행합니까? 이 선택은 설치 시간 및 성능 요구 사항에 따라 달라집니다.
- 사용자 지정 이미지를 통해:
- 마켓플레이스 이미지 사용
- NFS 공유, Blob Storage, Azure NetApp Files에서
- 애플리케이션을 실행하는 데 사용해야 하는 특정 VM 버전이 있나요? MPI가 요구 사항인가요? 이 경우 H 시리즈와 같은 다른 컴퓨터 제품군이 필요합니다.
- 각 애플리케이션에 대해 작업당 가장 적합한 코어 수는 무엇인가요?
- 스폿 VM을 사용할 수 있나요? CycleCloud에서 스폿 VM 사용
- 애플리케이션의 핵심 요구 사항을 충족할 수 있는 적절한 구독 할당량 이 있는지 확인합니다.
데이터
- Azure에서 입력 데이터가 상주하는 위치를 확인합니다. 이 결정은 애플리케이션의 성능 및 데이터 크기에 따라 달라집니다.
- 실행 노드에서 로컬로
- NFS 공유에서
- Blob Storage에서
- Azure NetApp Files 사용
- 출력 데이터에 사후 처리가 필요한지 확인
- 처리가 완료되면 출력 데이터가 상주하는 위치 결정
- 출력 데이터를 다른 곳에 복사해야 하는지 결정
- 보관 및 백업 요구 사항 확인
작업 제출
- 사용자가 작업을 제출하려면 어떻게 해야 합니까?
- 사용자에게 스케줄러 VM에서 실행할 스크립트가 있나요, 아니면 데이터 업로드 및 작업 제출에 도움이 되는 프런트 엔드가 있나요?
백업 및 재해 복구
- 클러스터 만들기에 템플릿을 사용하시겠습니까? 템플릿을 사용하면 CycleCloud 서버를 더 빠르게 다시 만들고 배포를 일관되게 유지합니다.
- 재해 복구 요구 사항은 무엇인가요? 예상한 경우 Azure 지역을 사용할 수 없는 경우 비즈니스에 어떤 일이 발생합니까?
- 내부 비즈니스에서 애플리케이션 SLA를 정의했나요?
- 다른 지역을 대기로 사용할 수 있나요?
- 작업이 오래 실행되고 있나요? 검사점 지정이 도움이 될까요?