SQL Server 빅 데이터 클러스터의 데이터 풀 소개

2021-07-16

적용 대상: SQL Server 2019(15.x)

중요합니다

Microsoft SQL Server 2019 빅 데이터 클러스터 추가 기능이 사용 중지됩니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일에 종료됩니다. Software Assurance를 사용하는 SQL Server 2019의 모든 기존 사용자는 플랫폼에서 완전히 지원되며, 소프트웨어는 지원 종료 시점까지 SQL Server 누적 업데이트를 통해 계속 유지 관리됩니다. 자세한 내용은 공지 블로그 게시물 및 Microsoft SQL Server 플랫폼의 빅 데이터 옵션을 참조하세요.

이 문서에서는 SQL Server 빅 데이터 클러스터에서 SQL Server 데이터 풀 의 역할을 설명합니다. 다음 섹션에서는 데이터 풀의 아키텍처, 기능 및 사용 시나리오에 대해 설명합니다.

이 5분 분량의 비디오에서는 데이터 풀을 소개하고 데이터 풀에서 데이터를 쿼리하는 방법을 보여 줍니다.

데이터 풀 아키텍처

데이터 풀은 클러스터에 대한 영구 SQL Server 스토리지를 제공하는 하나 이상의 SQL Server 데이터 풀 인스턴스로 구성됩니다. 외부 데이터 원본에 대해 캐시된 데이터를 성능 쿼리하고 작업 오프로드를 수행할 수 있습니다. 데이터는 T-SQL 쿼리 또는 Spark 작업을 사용하여 데이터 풀에 수집됩니다. 큰 데이터 집합에서 성능을 향상시키기 위해 수집된 데이터는 분할된 데이터베이스에 배포되고 풀의 모든 SQL Server 인스턴스에 저장됩니다. 지원되는 배포 방법은 라운드 로빈 및 복제입니다. 읽기 액세스 최적화를 위해 클러스터형 columnstore 인덱스는 각 데이터 풀 인스턴스의 각 테이블에 만들어집니다. 데이터 풀은 SQL Server 빅 데이터 클러스터의 스케일 아웃 데이터 마트 역할을 합니다.

스케일 아웃 데이터 마트

데이터 풀의 SQL Server 인스턴스에 대한 액세스는 SQL Server 마스터 인스턴스에서 관리됩니다. 데이터 캐시를 저장할 PolyBase 외부 테이블과 함께 데이터 풀에 대한 외부 데이터 원본이 만들어집니다. 백그라운드에서 컨트롤러는 외부 테이블과 일치하는 테이블을 사용하여 데이터 풀에 데이터베이스를 만듭니다. SQL Server 마스터 인스턴스에서 워크플로는 투명합니다. 컨트롤러는 컴퓨팅 풀을 통해 있을 수 있는 데이터 풀의 SQL Server 인스턴스로 특정 외부 테이블 요청을 리디렉션하고 쿼리를 실행하고 결과 집합을 반환합니다. 데이터 풀의 데이터는 수집하거나 쿼리할 수 있으며 수정할 수 없습니다. 따라서 모든 데이터 새로 고침에는 테이블 삭제가 필요하고 테이블 다시 작성 및 후속 데이터 다시 채워야 합니다.

데이터 풀 시나리오

보고 용도는 일반적인 데이터 풀 시나리오입니다. 예를 들어 주간 보고서에 사용되는 여러 PolyBase 데이터 원본을 조인하는 복잡한 쿼리를 데이터 풀로 오프로드할 수 있습니다. 캐시된 데이터는 로컬 빠른 컴퓨팅을 제공하며 원래 데이터 세트로 돌아갈 필요가 없습니다. 마찬가지로 주기적으로 새로 고쳐야 하는 대시보드 데이터는 최적화된 보고를 위해 데이터 풀에 캐시될 수 있습니다. Machine Learning 반복 탐색은 데이터 풀에서 데이터 세트의 캐싱을 활용할 수도 있습니다.

다음 단계

SQL Server 빅 데이터 클러스터에 대한 자세한 내용은 다음 리소스를 참조하세요.

다음을 통해 공유

SQL Server 빅 데이터 클러스터의 데이터 풀 소개

데이터 풀 아키텍처

데이터 풀 시나리오

다음 단계

추가 리소스