다음을 통해 공유


파워 쿼리 편집기에서 R 사용

R 언어는 많은 통계학자, 데이터 과학자 및 데이터 분석가가 사용하는 강력한 프로그래밍 언어입니다. Power BI Desktop의 파워 쿼리 편집기에서 R을 사용하여 다음을 수행할 수 있습니다.

  • 데이터 모델을 준비합니다.
  • 보고서를 만듭니다.
  • 누락된 데이터 완성, 예측, 클러스터링 등을 포함하는 데이터 정리, 고급 데이터 셰이핑 및 의미 체계 모델 분석을 수행합니다.

R 설치

CRAN 리포지토리무료로 R을 다운로드할 수 있습니다.

마우스 설치

필수 조건으로 R 환경에 마우스 라이브러리 설치해야 합니다. 마우스가 없으면 샘플 스크립트 코드가 제대로 작동하지 않습니다. 마우스 패키지는 누락된 데이터를 처리하는 메서드를 구현합니다.

마우스 라이브러리를 설치하려면 다음을 수행합니다.

  1. R.exe 프로그램(예: C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe)을 시작합니다.

  2. R 프롬프트에서 설치 명령을 실행합니다.

    install.packages('mice') 
    

파워 쿼리 편집기에서 R 스크립트 사용

파워 쿼리 편집기에서 R을 사용하는 방법을 설명하기 위해 이 예제에서는 .csv 파일에 포함된 주식 시장 의미 체계 모델을 사용합니다.

  1. EuStockMarkets_NA.csv 파일다운로드합니다. 저장 위치를 기억하세요.

  2. Power BI Desktop에 파일을 로드합니다. 탭에서 데이터 가져오기>텍스트/CSV을 선택합니다.

    스크린샷은 텍스트/CSV를 선택할 수 있는 데이터 가져오기 옵션을 보여줍니다.

  3. EuStockMarkets_NA.csv 파일을 선택한 다음 열기선택합니다. CSV 데이터는 텍스트/CSV 파일 대화 상자에 표시됩니다.

    스크린샷은 선택한 .csv 파일의 내용을 보여줍니다.

  4. 파일에서 데이터를 로드하려면 로드을 선택하십시오. Power BI Desktop에서 데이터를 로드하면 필드 창에 새 테이블이 나타납니다.

    스크린샷은 필드 창에 데이터를 표시합니다.

  5. 파워 쿼리 편집기를 열려면 리본에서 데이터 변환 선택합니다.

    스크린샷은 변환 데이터가 강조 표시된 홈 리본을 보여줍니다.

  6. 변환 탭에서 R 스크립트실행을 선택합니다. Run R 스크립트 편집기가 나타납니다. 15행과 20행에는 이미지에서 볼 수 없는 다른 행과 마찬가지로 누락된 데이터가 있습니다. 다음 단계에서는 R이 해당 행을 완료하는 방법을 보여 줍니다.

    [스크린샷은 R 스크립트 실행이 선택된 파워 쿼리 편집기를 보여줍니다.

  7. 이 예제에서는 실행 R 스크립트 창의 스크립트 상자에 다음 스크립트 코드를 입력합니다.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    메모

    필터가 적용된 새 의미 체계 모델을 제대로 만들려면 출력 변수를 덮어써야 할 수 있습니다.

  8. 을(를) 선택하고을(를) 확인합니다. 파워 쿼리 편집기에서 데이터 개인 정보 보호에 대한 경고를 표시합니다.

    스크린샷은 데이터를 보호하는 경고와 계속 옵션이 표시된 모습을 보여줍니다.

  9. 경고 메시지 내에서 계속을 선택하세요. 표시되는 개인 정보 수준 대화 상자에서 R 스크립트가 Power BI 서비스에서 제대로 작동하도록 모든 데이터 원본을 공용 설정합니다.

    스크린샷은 공개 개인 정보가 선택된 개인 정보 수준 대화 상자를 보여줍니다.

    개인 정보 설정 및 해당 의미에 대한 자세한 내용은 Power BI Desktop 개인 정보 수준참조하세요.

  10. 저장을 선택하여 스크립트를 실행합니다.

    스크립트를 실행하면 다음 결과가 표시됩니다.

    R 스크립트의 결과 스크린샷

    표시되는 테이블의 출력 옆에 있는 테이블 선택하면 다음 이미지와 같이 테이블이 표시됩니다.

    R 스크립트의 테이블 결과 스크린샷

    필드 창에 있는 새 열 completedValues을 주의하세요. SMI 누락 값 열에는 몇 가지 누락된 데이터 요소가 있습니다. R이 다음 섹션에서 이를 처리하는 방법을 살펴봅니다.

    5줄의 R 스크립트만 사용하여 파워 쿼리 편집기에서 누락된 값을 예측 모델로 채웠습니다.

R 스크립트 데이터에서 시각적 개체 만들기

이제 시각화를 생성하여 mice(마이스) 라이브러리가 있는 R 스크립트 코드가 누락된 값을 채우는 방법을 확인할 수 있습니다.

스크린샷은 누락된 값과 완료된 값을 포함하는 R 스크립트 시각적 개체를 보여줍니다.

완료된 모든 시각적 개체를 하나의 Power BI Desktop .pbix 파일에 저장하고 Power BI 서비스에서 데이터 모델 및 해당 R 스크립트를 사용할 수 있습니다.

메모

이러한 모든 단계가 완료된 상태에서 .pbix 파일 다운로드할 수 있습니다.

.pbix 파일을 Power BI 서비스에 업로드한 후 서비스 데이터 새로 고침 및 업데이트된 시각적 개체를 사용하도록 설정하는 다른 단계를 수행해야 합니다.

  • 의미 체계 모델예약된 새로 고침 사용: R 스크립트를 사용하여 의미 체계 모델이 포함된 통합 문서에 예약된 새로 고침을 사용하도록 설정하려면 예약된 새로 고침 구성하기참조하세요. 이 문서에는 온-프레미스 데이터 게이트웨이에 대한 정보도 포함되어 있습니다.

  • 게이트웨이설치: 파일 및 R이 있는 컴퓨터에 온-프레미스 데이터 게이트웨이(개인 모드)가 설치되어 있어야 합니다. Power BI 서비스는 해당 통합 문서에 액세스하고 업데이트된 시각적 개체를 다시 렌더링합니다. 자세한 내용은 Power BI 개인 게이트웨이 사용참조하세요.

고려 사항 및 제한 사항

파워 쿼리 편집기에서 만든 R 스크립트를 포함하는 쿼리에는 몇 가지 제한 사항이 있습니다.

  • 모든 R 데이터 원본 설정은 Public로 설정해야 합니다. 파워 쿼리 편집기 쿼리의 다른 모든 단계도 공용이어야 합니다.

    데이터 원본 설정으로 돌아가려면 Power BI Desktop에서 파일>옵션 및 설정>데이터 원본 설정선택합니다.

    스크린샷은 데이터 원본 설정을 선택할 수 있는 옵션 및 설정 대화 상자를 보여줍니다.

    데이터 원본 설정 대화 상자에서 하나 이상의 데이터 원본을 선택한 다음 사용 권한 편집선택합니다. 개인 정보 수준 공용 설정합니다.

    스크린샷은 사용 권한을 편집할 수 있는 데이터 원본 설정 대화 상자를 보여줍니다.

  • R 시각적 개체 또는 의미 체계 모델의 새로 고침을 예약하려면 예약된 새로 고침을 사용하도록 설정하고 통합 문서 및 R이 포함된 컴퓨터에 온-프레미스 데이터 게이트웨이(개인 모드)를 설치합니다. 엔터프라이즈 게이트웨이를 사용하여 파워 쿼리에 R 스크립트가 포함된 의미 체계 모델을 새로 고칠 수 없습니다.

R 및 사용자 지정 쿼리를 사용하여 수행할 수 있는 모든 종류의 작업을 수행할 수 있습니다. 원하는 방식으로 데이터를 탐색하고 셰이프합니다.