다음을 통해 공유


Azure Databricks에 Power BI Desktop 연결

이 페이지에서는 Microsoft Power BI Desktop에서 Azure Databricks에 연결하는 다양한 방법을 설명합니다. Power BI Desktop은 광범위한 원본에서 데이터에 연결, 셰이프 및 시각화할 수 있는 Windows 기반 애플리케이션입니다. Power BI Desktop을 사용하면 셀프 서비스 비즈니스 인텔리전스 도구를 사용하여 대화형 보고서 및 대시보드를 만들 수 있습니다.

Power BI에서 Azure Databricks를 데이터 원본으로 사용하는 경우 데이터 과학자 및 데이터 엔지니어를 넘어 모든 비즈니스 사용자로 Azure Databricks의 성능과 기능을 확장합니다.

Power BI Desktop을 Azure Databricks 클러스터 및 Databricks SQL 웨어하우스에 연결할 수 있습니다. Power BI 서비스에 Power BI 보고서를 게시하고 사용자가 SSO(Single Sign-On)를 사용하여 기본 Azure Databricks 데이터에 액세스할 수 있도록 하여 보고서에 액세스하는 데 사용하는 것과 동일한 Microsoft Entra ID 자격 증명을 전달할 수도 있습니다.

Power BI Desktop에서 Azure Databricks에 연결하려면 다음 방법 중 하나를 선택합니다.

Azure Databricks에서 Power BI 서비스에 데이터를 게시하려면 Azure Databricks에서 Power BI 서비스에 게시를 참조하세요.

비고

Power BI용 Azure Databricks 커넥터는 ADBC(Arrow Database Connectivity) 드라이버를 지원합니다. 여기서 자세히 알아봅니다.

요구 사항

  • Power BI에서 Unity 카탈로그에서 관리하는 데이터를 사용하려면 Databricks에서 최신 버전의 Power BI Desktop을 사용하는 것이 좋습니다.

비고

운영 체제가 Windows가 아닌 경우 물리적 호스트 또는 Windows 기반 가상 머신에서 Power BI Desktop을 실행한 다음 운영 체제에서 연결합니다.

2.85.681.0 미만의 Power BI Desktop 버전을 사용하는 경우 Power BI Desktop과 동일한 환경에 Databricks ODBC 드라이버를 설치합니다.

파트너 연결을 사용하여 Azure Databricks에 연결

파트너 연결을 사용하여 Power BI Desktop에서 클러스터 또는 SQL 웨어하우스에 연결할 수 있습니다.

  1. Azure Databricks 계정, 작업 영역 및 로그인한 사용자가 Partner Connect에 대한 요구 사항을 충족하는지 확인합니다.

  2. 사이드바에서 Marketplace 아이콘Marketplace을 클릭합니다.

  3. 파트너 연결 통합에서 모든 보기를 클릭합니다.

  4. Power BI 타일을 클릭합니다.

  5. 파트너에 연결 대화 상자에서 컴퓨팅의 경우 연결하려는 Azure Databricks 컴퓨팅 리소스의 이름을 선택합니다.

  6. 연결 파일 다운로드를 선택합니다.

  7. 다운로드한 연결 파일을 열고 Power BI Desktop을 시작합니다.

  8. Power BI Desktop에서 인증 자격 증명을 입력합니다.

    • 개인용 액세스 토큰: Azure Databricks 개인용 액세스 토큰을 입력합니다.
    • Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.
    • 클라이언트 자격 증명: M2M OAuth에 사용합니다. 서비스 주체의 클라이언트 ID 및 클라이언트 암호를 입력합니다.
  9. 연결을 클릭합니다.

  10. Power BI Navigator에서 Azure Databricks 쿼리할 데이터를 선택합니다.

    Power BI 탐색기

수동으로 Azure Databricks에 연결

다음 지침을 참조하여 선택한 인증 방법에 따라 Power BI Desktop을 사용하여 클러스터 또는 SQL 웨어하우스에 연결합니다. DirectQuery 모드에서 Power BI를 사용하는 경우 Databricks SQL 웨어하우스를 사용하는 것이 좋습니다.

비고

Power BI Desktop을 사용하여 더 빠르게 연결하려면 Partner Connect를 사용합니다.

  1. 서버 호스트 이름 및 HTTP 경로가져옵니다.

  2. Power BI Desktop을 시작합니다.

  3. 데이터 가져오기 또는 파일 > 데이터 가져오기클릭합니다.

  4. 데이터를 가져오기를 클릭하여시작합니다.

  5. Databricks를 검색한 다음, 커넥터 Azure Databricks를 클릭합니다.

  6. 연결을 클릭합니다.

  7. 서버 호스트 이름HTTP 경로를 입력합니다.

  8. 데이터 연결 모드를 선택합니다. 가져오기DirectQuery의 차이점에 대한 자세한 내용은 Power BI Desktop에서 DirectQuery 사용을 참조하세요.

  9. OK를 클릭합니다.

  10. 인증 방법을 클릭합니다.

    • 개인용 액세스 토큰: 입력하세요

      Azure Databricks 개인용 액세스 토큰입니다.

    • Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.

    • 클라이언트 자격 증명: 서비스 주체를 사용하여 인증하는 경우 사용합니다. 서비스 주체의 클라이언트 ID 및 클라이언트 암호를 입력합니다.

  11. 연결을 클릭합니다.

  12. Power BI Navigator에서 Azure Databricks 쿼리할 데이터를 선택합니다.

    Power BI 탐색기

Power BI Delta Sharing 커넥터

Power BI Delta Sharing 커넥터를 사용하면 Delta Sharing 개방형 프로토콜을 통해 공유된 데이터 세트를 검색, 분석 및 시각화할 수 있습니다. 이 프로토콜을 사용하면 REST 및 클라우드 스토리지를 활용하여 제품 및 플랫폼에서 데이터 세트를 안전하게 교환할 수 있습니다. 이 메서드는 가져오기 모드만 지원하며 Azure Databricks가 아닌 사용자와 데이터를 공유할 수 있습니다.

연결 지침은 Power BI: 공유 데이터 읽기를 참조하세요.

연결 구성

Azure Databricks Power BI 커넥터는 다음과 같은 추가 연결 구성을 지원합니다.

네이티브 SQL 쿼리

Databricks 커넥터를 사용하면 Power BI Desktop의 Databricks SQL 웨어하우스에 대해 더 큰 작업 및 계산 집약적 쿼리에 네이티브 SQL 쿼리를 사용할 수 있습니다. 이를 위해서는 Power BI v2.112.603.0 이상이 필요합니다(2022년 12월 릴리스).

네이티브 SQL 쿼리를 사용하려면 Power BI Desktop에서 다음을 수행합니다.

  1. 데이터 가져오기 메뉴에서 Azure Databricks 데이터 원본을 찾습니다.
  2. 연결 대화 상자에서 카탈로그 및 데이터베이스 서버 세부 정보를 입력합니다. 이러한 필드는 네이티브 쿼리를 사용하려는 경우에 필요합니다.
  3. 네이티브 쿼리에서 제출할 SQL 쿼리를 입력합니다.
  4. 인증한 후에는 쿼리할 수 있습니다.
  5. 쿼리를 수정하려면 Power BI 고급 쿼리 편집기를 사용합니다. 변경하면 쿼리를 저장합니다.

자동 HTTP 프록시 검색

Power BI Desktop 버전 2.104.941.0 이상(2022년 5월 릴리스)에는 Windows 시스템 차원의 HTTP 프록시 구성을 검색하기 위한 기본 제공 지원이 있습니다.

Power BI Desktop은 Windows 시스템 차원의 HTTP 프록시 구성을 자동으로 검색하고 사용할 수 있습니다.

프록시 서버가 CDP(CRL 배포 지점)를 제공하지 않는 경우 Power BI에서 다음과 같은 오류 메시지를 표시할 수 있습니다.

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

이 오류를 해결하려면 다음 단계를 완료합니다.

  1. C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini 파일이 없으면 만듭니다.

  2. microsoft.sparkodbc.ini 파일에 다음 구성을 추가합니다.

    [Driver]
    CheckCertRevocation=0
    

제한점

  • Azure Databricks 커넥터는 웹 프록시를 지원합니다. 그러나 파일에 정의된 .pac 자동 프록시 설정은 지원되지 않습니다.
  • Azure Databricks 커넥터에서 Databricks.Query 데이터 원본은 DirectQuery 모드와 함께 지원되지 않습니다.
  • 델타 공유 커넥터를 사용하여 로드하는 데이터는 컴퓨터의 로컬 메모리에 맞아야 합니다. 이를 위해 커넥터는 가져온 행 수를 초기 연결 설정 중에 설정된 행 제한 으로 제한합니다. Power BI: 공유 데이터 읽기를 참조하세요.

추가 리소스

지원

파워 쿼리 설명서