Lakehouse는 Microsoft Fabric의 수명 주기 관리 기능과 통합되어 제품 수명 동안 모든 개발 팀 구성원 간에 표준화된 협업을 제공합니다. 수명 주기 관리는 기능 및 버그 수정을 여러 환경에 지속적으로 제공하여 효과적인 제품 버전 관리 및 릴리스 프로세스를 용이하게 합니다. 자세한 내용은 Microsoft Fabric에서 수명 주기 관리란?을 참조하세요.
중요합니다
이 기능은 미리 보기로 제공됩니다.
Lakehouse git 통합
Lakehouse는 작업 영역의 여러 개체에서 참조되는 메타데이터와 데이터를 모두 포함하는 항목입니다. Lakehouse에는 테이블, 폴더 및 바로 가기가 관리 가능한 기본 데이터 컨테이너 항목으로 포함됩니다. 개발 워크플로 관점에서 다음 종속 개체는 Lakehouse를 참조할 수 있습니다.
- 데이터 흐름 및 데이터 파이프라인
- Spark 작업 정의
- 노트북
- 의미 체계 모델 및 Power BI
기본 의미 체계 모델 및 SQL 분석 엔드포인트 메타데이터는 Lakehouse와 관련이 있으며 기본적으로 git 업데이트 프로세스에서 관리됩니다. 원칙 데이터는 git에서 추적되지 않으므로 메타데이터만 추적됩니다.
Git 표현
다음 Lakehouse 정보는 git 연결된 작업 영역에서 직렬화되고 추적됩니다.
- 표시 이름
- 설명
- 논리적 GUID
참고 항목
추적된 논리 GUID는 항목과 해당 소스 제어 표현을 나타내는 자동으로 생성된 작업 영역 간 식별자입니다.
중요합니다
현재 환경에서는 Lakehouse 컨테이너 아티팩트만 git에서 추적됩니다. 테이블(델타 및 델타가 아닌 테이블) 및 파일 섹션의 폴더는 git추적 및 버전 관리되지 않습니다.
Lakehouse git 통합 기능
다음과 같은 기능을 사용할 수 있습니다.
- Lakehouse 개체 메타데이터를 git JSON 표현으로 직렬화합니다.
- 변경 내용을 직접 적용하거나 끌어오기 요청을 사용하여 업스트림 또는 다운스트림 작업 영역 및 분기에 대한 변경 내용을 제어합니다.
- Lakehouse 이름 바꾸기는 git에서 추적됩니다. 이름이 바뀐 Lakehouse를 업데이트하면 기본 의미 체계 데이터 모델 및 SQL Analytics 엔드포인트의 이름도 바뀝니다.
- 테이블 및 폴더 메타데이터에 작업이 적용되지 않으며 해당 항목의 데이터는 항상 유지됩니다.
- OneLake 바로 가기 메타데이터 git에 유지됩니다.
OneLake의 바로 가기 및 Git 통합 기능
- 테이블 및 파일 섹션의 바로 가기 정의는 git의 lakehouse 폴더 아래
shortcuts.metadata.json
파일에 저장됩니다. - 다음 작업이 자동으로 지원되고 추적됩니다. 추가, 삭제 및 업데이트.
- 작업은
shortcuts.metadata.json
파일을 변경하여 패브릭 사용자 인터페이스 또는 git 리포지토리에서 직접 수행할 수 있습니다. - 내부 대상(OneLake 바로 가기)이 있는 바로 가기는 git 동기화 중에 자동으로 업데이트됩니다. 바로 가기가 유효하려면 해당 참조가 작업 영역에서 유효한 대상이어야 합니다. 레이크하우스 테이블 섹션에 정의된 바로 가기에 대상이 잘못되었으면, 참조가 해결될 때까지 해당 바로 가기가
Unidentified
섹션으로 이동됩니다.
중요합니다
shortcuts.metadata.json
파일에서 OneLake 바로 가기 속성을 직접 변경할 때는 주의해야 합니다. 속성(특히 GUID)을 잘못 변경하면 업데이트가 작업 영역에 다시 적용될 때 OneLake 바로 가기가 잘못 렌더링될 수 있습니다.
중요합니다
git 업데이트가 작업 공간의 바로 가기 상태를 재정의합니다. 작업 영역의 모든 바로 가기는 git에서 들어오는 상태에 따라 생성, 업데이트 또는 삭제됩니다.
배포 파이프라인의 Lakehouse
Lakehouse는 Microsoft Fabric 수명 주기 관리 배포 파이프라인에서 지원됩니다. 이를 통해 환경 세분화 모범 사례를 사용할 수 있습니다.
Lakehouse 배포 파이프라인 통합 기능.
개발, 테스트 및 프로덕션 작업 영역에서 배포합니다.
Lakehouse는 배포 시 종속 개체로 제거할 수 있습니다. 배포 파이프라인 컨텍스트 내에서 다른 Lakehouse 매핑도 지원됩니다.
배포 파이프라인 구성 중에 아무것도 지정하지 않으면 동일한 이름의 빈 Lakehouse 개체가 대상 작업 영역에 만들어집니다. Notebook 및 Spark 작업 정의는 새 작업 영역의 새 Lakehouse 개체를 참조하도록 다시 매핑됩니다.
업스트림 Lakehouse와 같이 배포 파이프라인 구성 시간 동안 다른 Lakehouse를 참조하도록 Lakehouse 종속성이 구성된 경우 동일한 이름의 새 빈 Lakehouse 개체가 대상 작업 영역에 계속 만들어지지만 Notebook 및 Spark 작업 정의 참조는 요청에 따라 다른 Lakehouse에 유지됩니다.
SQL Analytics 엔드포인트 및 의미 체계 모델은 Lakehouse 배포의 일부로 프로비전됩니다.
Lakehouse 내부에는 개체를 덮어쓰지 않습니다.
Lakehouse 이름에 대한 업데이트는 배포 파이프라인 컨텍스트의 작업 영역에서 동기화할 수 있습니다.
배포 파이프라인의 OneLake 바로 가기
- 바로 가기 정의는 배포 파이프라인의 여러 단계에서 동기화됩니다.
- 외부 대상(ADLS Gen2, S3 등)이 있는 바로 가기는 배포 후 모든 단계에서 동일합니다.
- 동일한 작업 영역에서 내부 대상을 포함하는 OneLake 바로 가기는 단계 간에 자동으로 다시 매핑됩니다. 데이터 웨어하우스 및 의미 체계 모델을 대상으로 하는 바로 가기는 배포 중에 다시 매핑되지 않습니다. 테이블, 폴더 및 파일은 대상 작업 영역에 만들어지지 않습니다. 바로 가기가 유효하려면 배포 후 대상 작업 영역에서 해당 참조를 만들어야 합니다.
- 동일한 바로 가기가 여러 스테이지에서 다른 위치를 대상으로 지정해야 하는 시나리오에서. 예를 들어 개발에서 Amazon S3의 특정 폴더를 가리키고 프로덕션에서는 ADLS Gen2의 다른 폴더를 가리킵니다. 권장되는 방법은 바로 가기 정의에서 변수를 사용하는 것입니다. 변수 라이브러리 및 Microsoft Fabric에서 변수 라이브러리를 효과적으로 사용하는 방법에 대한 자세한 내용은 변수 라이브러리란?을 읽어보세요. (미리 보기) 기사. 또 다른 옵션으로는 배포 후에 Lakehouse에서 OneLake API를 사용하여 직접 OneLake 바로 가기 정의를 수동으로 업데이트하는 것입니다.
중요합니다
배포 은 대상 작업 공간의 바로 가기 상태를 덮어씁니다. 대상 레이크하우스의 모든 바로 가기는 원본 레이크하우스의 상태에 따라 업데이트되거나 삭제됩니다. 대상 레이크하우스에 새 바로 가기가 만들어집니다. 항상 "변경 내용 검토"를 클릭하여 원본 작업 영역과 대상 작업 영역 간에 배포될 변경 내용을 이해합니다.