다음을 통해 공유


패브릭의 미러링이란?

패브릭의 미러링은 다양한 시스템의 데이터를 단일 분석 플랫폼으로 통합하는 저비용 및 짧은 대기 시간 솔루션입니다. 다양한 Azure 데이터베이스 및 외부 데이터 원본에서 기존 데이터 자산을 Fabric의 OneLake에 직접 지속적으로 복제할 수 있습니다.

OneLake에서 쿼리 가능한 형식으로 가장 up-to날짜 데이터를 사용하면 이제 Spark로 분석 실행, Notebook 실행, 데이터 엔지니어링, Power BI 보고서 시각화 등 패브릭의 모든 다른 서비스를 사용할 수 있습니다.

Fabric의 미러링을 사용하면 분석 요구 사항을 간소화하도록 설계된 고도로 통합되고 엔드 투 엔드 및 사용하기 쉬운 제품을 즐길 수 있습니다. 오픈 소스 Delta Lake 테이블 형식을 읽을 수 있는 기술 솔루션과 Microsoft 간의 개방성과 협업을 위해 빌드된 미러링(Mirroring)은 모든 분석 요구에 사용할 수 있는 OneLake에서 데이터의 복제본을 만들 수 있는 저렴한 비용 및 짧은 대기 시간 턴키 솔루션입니다.

그러면 델타 테이블을 패브릭의 모든 곳에서 사용할 수 있으므로 사용자가 Fabric으로의 여정을 가속화할 수 있습니다.

패브릭에서 미러링을 사용하는 이유는 무엇인가요?

오늘날 많은 조직에서 업무상 중요한 운영 또는 분석 데이터가 사일로에 있습니다.

현재 이 데이터에 액세스하고 작업하려면 복잡한 ETL(변환 로드 추출) 파이프라인, 비즈니스 프로세스 및 의사 결정 사일로가 필요합니다.

  • 중요하고 항상 변경되는 데이터에 대한 액세스가 제한되고 제한됨
  • 사람, 프로세스 및 기술 간의 마찰
  • 매우 중요한 데이터에 대한 파이프라인 및 프로세스를 만들기 위한 긴 대기 시간
  • 인사이트를 편안하게 분석하고 공유하는 데 필요한 도구를 자유롭게 사용할 수 없습니다.
  • 사람들이 데이터를 공유하고 공동 작업할 수 있는 적절한 기반이 부족합니다.
  • BI, AI, 통합, 엔지니어링 및 앱 등 모든 분석 시나리오에 대해 일반적인 개방형 데이터 형식이 없습니다.

패브릭의 미러링을 사용하면 인사이트 및 의사 결정에 대한 가치 창출 시간을 단축하고 기술 솔루션 간의 데이터 사일로를 세분화할 수 있는 간편한 환경을 제공합니다.

  • BI 및 AI용 기본 제공 분석이 기본 제공된 SaaS 데이터 레이크로 데이터 및 메타데이터를 거의 실시간으로 복제

Microsoft Fabric 플랫폼은 SaaS(Software as a Service)의 기초를 기반으로 하며, 단순성과 통합을 완전히 새로운 수준으로 끌어올립니다. Microsoft Fabric에 대한 자세한 내용은 Microsoft Fabric이란?

미러링에서는 패브릭 작업 영역에서 다음 항목을 만듭니다.

  • 미러링에서는 데이터 및 메타데이터를 OneLake 로 복제하고 분석을 준비한 형식으로 Parquet으로 변환합니다. 이를 통해 데이터 엔지니어링, 데이터 과학 등과 같은 다운스트림 시나리오를 사용할 수 있습니다.
  • SQL 분석 엔드포인트

SQL 쿼리 편집기 외에도 SSMS(SQL Server Management Studio),Visual Studio Code를 사용한 mssql 확장, 심지어 GitHub를 비롯한 광범위한 도구 에코시스템이 있습니다Copilot.

공유 를 사용하면 액세스 제어 및 관리가 용이하여 중요한 정보에 대한 액세스를 제어할 수 있습니다. 또한 공유를 통해 조직 전체에서 안전하고 민주화된 의사 결정을 내릴 수 있습니다.

미러링 유형

패브릭은 미러링을 통해 OneLake로 데이터를 가져오는 세 가지 방법을 제공합니다.

  • 데이터베이스 미러링 – Microsoft Fabric의 데이터베이스 미러링을 사용하면 전체 데이터베이스와 테이블을 복제할 수 있으므로 다양한 시스템의 데이터를 단일 분석 플랫폼으로 가져올 수 있습니다.
  • 메타데이터 미러링 – 패브릭의 메타데이터 미러링이 데이터를 물리적으로 이동하는 대신 메타데이터(예: 카탈로그 이름, 스키마 및 테이블)를 동기화합니다. 이 방법은 바로 가기를 활용하여 패브릭 내에서 쉽게 액세스할 수 있는 동시에 데이터가 원본에 유지되도록 합니다.
  • 오픈 미러링 – 패브릭의 개방형 미러링이 개방형 Delta Lake 테이블 형식에 따라 미러링을 확장하도록 설계되었습니다. 이 기능을 사용하면 모든 개발자가 개방형 미러링 접근 방식 및 공용 API를 기반으로 애플리케이션의 변경 데이터를 Microsoft Fabric의 미러된 데이터베이스 항목에 직접 쓸 수 있습니다.

현재 다음과 같은 외부 데이터베이스를 사용할 수 있습니다.

Platform 근 실시간 복제 미러링 유형 엔드 투 엔드 자습서
Azure Cosmos DB의 Microsoft Fabric 미러된 데이터베이스(미리 보기) Yes 데이터베이스 미러링 자습서: Azure Cosmos DB
Azure Databricks의 Microsoft Fabric 미러된 데이터베이스 Yes 메타데이터 미러링 자습서: Azure Databricks
Azure Database for PostgreSQL 유연한 서버의 Microsoft Fabric 미러된 데이터베이스(미리 보기) Yes 데이터베이스 미러링 자습서: Azure Database for PostgreSQL 유연한 서버
Azure SQL Database의 Microsoft Fabric 미러된 데이터베이스 Yes 데이터베이스 미러링 자습서: Azure SQL Database
Microsoft Fabric의 Azure SQL Managed Instance에서 미러된 데이터베이스 Yes 데이터베이스 미러링 자습서: Azure SQL Managed Instance
Google BigQuery의 Microsoft Fabric 미러된 데이터베이스(미리 보기) Yes 데이터베이스 미러링 자습서: Google BigQuery
Oracle의 Microsoft Fabric 미러된 데이터베이스(미리 보기) Yes 데이터베이스 미러링 자습서: Oracle
Snowflake의 Microsoft Fabric 미러된 데이터베이스 Yes 데이터베이스 미러링 자습서: Snowflake
SQL Server의 Microsoft Fabric 미러된 데이터베이스(미리 보기) Yes 데이터베이스 미러링 자습서: SQL Server
미러된 데이터베이스 열기 Yes 미러링 열기 자습서: 미러링 열기
Fabric SQL 데이터베이스의 Microsoft Fabric 미러된 데이터베이스 (미리 보기) Yes 데이터베이스 미러링 자동으로 구성됨

데이터베이스 미러링의 거의 실시간 복제는 어떻게 작동하나요?

운영 데이터 원본에 대한 보안 연결을 만들어 미러링을 사용하도록 설정합니다. 전체 데이터베이스 또는 개별 테이블을 복제할지 여부를 선택하면 미러링이 자동으로 데이터를 동기화 상태로 유지합니다. 설정되면 데이터는 분석 사용을 위해 OneLake에 지속적으로 복제됩니다.

미러링의 핵심 개념은 다음과 같습니다.

  • 패브릭에서 미러링을 사용하도록 설정하는 것은 복잡한 ETL 파이프라인을 만들고, 다른 컴퓨팅 리소스를 할당하고, 데이터 이동을 관리할 필요 없이 간단하고 직관적입니다.

  • 패브릭의 미러링은 완전히 관리되는 서비스이므로 미러된 연결의 복제를 호스팅, 유지 관리 또는 관리하는 것에 대해 걱정할 필요가 없습니다.

메타데이터 미러링의 작동 방식

미러링을 사용하면 데이터 복제가 가능할 뿐만 아니라 전체 데이터 복제가 아닌 바로 가기 또는 메타데이터 미러링을 통해 수행할 수 있으므로 데이터를 물리적으로 이동하거나 복제하지 않고도 데이터를 사용할 수 있습니다. 이 컨텍스트에서 미러링하는 것은 실제 데이터 자체가 아니라 카탈로그 이름, 스키마 및 테이블과 같은 메타데이터만 복제하는 것을 의미합니다. 이 접근 방식을 통해 Fabric은 복제하지 않고도 다양한 원본의 데이터에 액세스할 수 있도록 하여 데이터 관리를 간소화하고 스토리지 요구 사항을 최소화할 수 있습니다.

예를 들어 Unity 카탈로그에 등록된 데이터에 액세스할 때 Fabric은 Azure Databricks의 카탈로그 구조만 미러링하여 기본 데이터에 바로 가기를 통해 액세스할 수 있도록 합니다. 이 방법을 사용하면 데이터 이동, 실시간 동기화 유지 관리, up-to날짜 정보 액세스 효율성 향상 없이 원본 데이터의 모든 변경 내용이 패브릭에 즉시 반영됩니다.

개방형 미러링의 작동 방식

데이터 원본에 대한 보안 연결을 만들어 데이터 복제를 사용하도록 설정하는 미러링 외에도 기존 데이터 공급자를 선택하거나 자체 애플리케이션을 작성하여 데이터를 미러된 데이터베이스에 배치할 수도 있습니다. 공개 API 또는 패브릭 포털을 통해 열린 미러된 데이터베이스 를 만들면 OneLake에서 랜딩 존 URL을 얻을 수 있으며, 여기서 열린 미러링 사양에 따라 변경 데이터를 가져올 수 있습니다.

데이터가 적절한 형식의 랜딩 존에 있으면 복제가 실행되기 시작하고 변경 내용을 업데이트, 삽입 및 삭제와 병합하여 델타 테이블에 반영되는 복잡성을 관리합니다. 이 메서드는 랜딩 존에 기록된 모든 데이터가 즉시 유지되고 패브릭에서 데이터를 -date up-to유지하도록 합니다.

공유

공유를 사용하면 액세스 제어 및 관리가 용이하며, RLS(행 수준 보안) 및 OLS(개체 수준 보안)와 같은 보안 제어를 통해 중요한 정보에 대한 액세스를 제어할 수 있습니다. 또한 공유를 통해 조직 전체에서 안전하고 민주화된 의사 결정을 내릴 수 있습니다.

공유를 통해 사용자는 작업 영역 및 나머지 항목에 대한 액세스 권한을 부여하지 않고 다른 사용자 또는 사용자 그룹에 미러된 데이터베이스에 대한 액세스 권한을 부여합니다. 미러된 데이터베이스를 공유하는 경우 SQL 분석 엔드포인트에 대한 액세스 권한도 부여합니다.

자세한 내용은 미러된 데이터베이스 공유 및 권한 관리를 참조하세요.

데이터베이스 간 쿼리

OneLake에 저장된 미러된 데이터베이스의 데이터를 사용하여 데이터베이스 간 쿼리를 작성하여 단일 T-SQL 쿼리로 Lakehouses의 미러된 데이터베이스, 웨어하우스 및 SQL 분석 엔드포인트의 데이터를 조인할 수 있습니다. 자세한 내용은 데이터베이스 간 쿼리 작성을 참조하세요.

예를 들어 3부로 구성된 이름을 사용하여 미러된 데이터베이스 및 웨어하우스에서 테이블을 참조할 수 있습니다. 다음 예제에서는 세 부분으로 구성된 이름을 사용하여 웨어하우스ContosoSalesTable에서 참조합니다ContosoWarehouse. 다른 데이터베이스 또는 웨어하우스에서 표준 SQL 세 부분으로 구성된 명명 규칙의 첫 번째 부분은 미러된 데이터베이스의 이름입니다.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

미러링 비용

데이터베이스 미러링 및 개방형 미러링의 경우 패브릭 컴퓨팅 및 OneLake 스토리지는 용량 기반 제한까지 사용할 수 있습니다.

  • 복제본에 대한 스토리지는 용량 크기에 따라 최대 한도까지 사용할 수 있습니다. 미러링에서는 구매한 모든 CU(용량 단위)에 대해 테라바이트 단위의 미러링 스토리지를 무료로 제공합니다. 예를 들어 F64 용량을 구매하는 경우 미러링에만 사용되는 64테라바이트 상당의 스토리지를 얻을 수 있습니다. 무료 미러링 스토리지 한도를 초과하거나 용량이 일시 중지된 경우 OneLake 스토리지 요금이 청구됩니다. 자세한 내용은 Microsoft Fabric 가격 책정을 참조하세요.
  • 데이터를 Fabric OneLake에 복제하는 데 사용되는 백그라운드 패브릭 컴퓨팅은 무료이며 용량을 사용하지 않습니다. 미러된 데이터에 대한 OneLake에 대한 직접 요청은 일반 OneLake 컴퓨팅 사용량으로 용량을 사용합니다. SQL, Power BI 또는 Spark를 사용하여 데이터를 쿼리하기 위한 컴퓨팅은 일반 요금으로 청구됩니다.
  • 실행 중인 패브릭 용량은 미러링의 초기 설정에만 필요합니다.

미러된 데이터베이스 데이터를 사용하여 데이터 엔지니어링

Microsoft Fabric은 데이터에 쉽게 액세스할 수 있고, 잘 구성되고, 고품질이 되도록 다양한 데이터 엔지니어링 기능을 제공합니다. 패브릭 데이터 엔지니어링에서 다음을 수행할 수 있습니다.

  • Lakehouse를 사용하여 Spark로 데이터 만들기 및 관리
  • 레이크하우스에 데이터를 복사하는 파이프라인 디자인
  • Spark 작업 정의를 사용하여 Spark 클러스터에 일괄 처리/스트리밍 작업 제출
  • Notebook을 사용하여 데이터 수집, 준비 및 변환에 대한 코드 작성

미러된 데이터베이스 데이터를 사용하는 데이터 과학

Microsoft Fabric은 사용자가 데이터 보강 및 비즈니스 인사이트를 위해 엔드 투 엔드 데이터 과학 워크플로를 완료할 수 있도록 하는 패브릭 데이터 과학을 제공합니다. 데이터 탐색, 준비 및 정리에서 실험, 모델링, 모델 점수 매기기 및 예측 인사이트 제공에서 BI 보고서에 이르기까지 전체 데이터 과학 프로세스에서 광범위한 활동을 완료할 수 있습니다.

Microsoft Fabric 사용자는 데이터 과학 워크로드에 액세스할 수 있습니다. 여기에서 다양한 관련 리소스를 검색하고 액세스할 수 있습니다. 예를 들어 기계 학습 실험, 모델 및 Notebook을 만들 수 있습니다. 또한 데이터 과학 홈 페이지에서 기존 Notebook을 가져올 수도 있습니다.

미러된 데이터베이스 데이터가 있는 Direct Lake

Direct Lake 모드를 Microsoft Fabric의 미러된 데이터베이스와 함께 사용하여 데이터 이동 또는 중복 없이 미러된 데이터에 대해 고성능 쿼리를 수행할 수 있습니다. 미러된 데이터베이스가 만들어지면 해당 데이터는 OneLake 내에서 Delta Lake 형식으로 저장됩니다. 이 네이티브 형식을 사용하면 Power BI 및 기타 분석 도구가 Direct Lake 모드를 통해 연결하여 기본 파일에 직접 액세스하여 거의 실시간으로 인사이트를 제공할 수 있습니다. 이 통합은 미러링의 단순성과 Direct Lake의 속도 및 확장성을 결합하여 운영 데이터에 대한 빠르고 up-to날짜 보고를 가능하게 합니다.

미러된 데이터에 대한 보존

Fabric의 미러링에서는 델타 레이크 테이블 형식의 OneLake에 기존 데이터 자산을 지속적으로 복제합니다. 미러된 데이터를 효율적으로 저장하고 항상 분석할 준비가 되도록 미러링이 자동으로 진공 상태로 실행되어 델타 로그에서 더 이상 참조되지 않는 오래된 파일을 제거합니다.

요구 사항에 따라 보존 설정을 사용자 지정할 수 있습니다. 예를 들어 미러링 스토리지 사용량을 줄이거나 보존 기간을 연장하여 분석을 위해 델타의 시간 이동 기능을 활용하기 위해 더 짧은 보존 기간을 선택할 수 있습니다.

2025년 6월 중순 이후 패브릭 포털에서 만든 미러된 데이터베이스의 경우 기본 보존 기간은 1일입니다. 이전 미러된 데이터베이스의 경우 기본값은 7일입니다. 보존 설정을 확인하거나 업데이트하려면 패브릭 포털에서 미러된 데이터베이스 -> ->유지 관리 탭으로 이동하여 보존 임계값을 지정합니다. 속성을 지정하여 공용 API 를 통해 구성할 수도 있습니다 retentionInDays .

패브릭의 SQL 데이터베이스

패브릭 포털 내에서 Microsoft Fabric(미리 보기)에서 SQL 데이터베이스 를 직접 만들고 관리할 수도 있습니다. Azure SQL Database에 따라 Fabric의 SQL 데이터베이스는 분석을 위해 자동으로 미러링되며 Fabric에서 운영 데이터베이스를 쉽게 만들 수 있습니다. SQL 데이터베이스는 OLTP 워크로드용 패브릭의 홈이며 패브릭의 소스 제어 통합과 통합할 수 있습니다.