다음을 통해 공유


Azure에서 데이터 분석 및 보고 기술 선택

대부분의 빅 데이터 솔루션의 목표는 분석 및 보고를 통해 데이터에 대한 정보를 제공하는 것입니다. 분석 및 보고에는 미리 구성된 보고서 및 시각화 또는 대화형 데이터 탐색이 포함될 수 있습니다.

데이터 분석 기술 옵션

Azure에서는 사용자의 요구에 따라 분석, 시각화 및 보고에 대한 여러 옵션을 사용할 수 있습니다.

Power BI

Power BI는 비즈니스 분석 도구 제품군입니다. 수백 개의 데이터 원본에 연결할 수 있으며 계획되지 않은 분석에 사용할 수 있습니다. Power BI Embedded를 사용하여 추가 라이선스 없이도 자체 애플리케이션 내에 Power BI를 통합합니다.

조직에서는 Power BI를 사용하여 보고서를 생성하고 조직에 게시할 수 있습니다. 모든 사용자는 거버넌스 및 기본 제공된 보안을 사용하여 개인별 대시보드를 만들 수 있습니다. Power BI는 Microsoft Entra ID 를 사용하여 Power BI 서비스에 로그인하는 사용자를 인증합니다. 사용자가 인증이 필요한 리소스에 액세스하려고 할 때 Power BI 자격 증명을 사용합니다.

Jupyter 노트북

Jupyter Notebook은 데이터 과학자가 Python, Scala 또는 R 코드 및 Markdown 텍스트를 포함하는 Notebook 파일을 만들 수 있는 브라우저 기반 셸을 제공합니다. 이러한 기능을 통해 Notebook은 코드를 공유하고 문서화하여 공동 작업하고 단일 문서를 만드는 효과적인 방법을 제공합니다.

Spark 또는 Hadoop과 같은 대부분의 HDInsight 클러스터는 데이터와 상호 작용하고 처리를 위해 작업을 제출하기 위해 Jupyter Notebook으로 미리 구성 됩니다. 사용하는 HDInsight 클러스터 유형에 따라 코드를 해석하고 실행하기 위해 하나 이상의 커널이 제공됩니다. 예를 들어 HDInsight의 Spark 클러스터는 Spark 엔진을 사용하여 Python 또는 Scala 코드를 실행하도록 선택할 수 있는 Spark 관련 커널을 제공합니다.

Jupyter Notebook은 Power BI와 같은 BI 보고 도구를 사용하여 고급 시각화를 빌드하기 전에 데이터를 분석, 시각화 및 처리하기 위한 효과적인 환경을 제공합니다.

Zeppelin Notebooks

Zeppelin Notebook은 Jupyter Notebook과 유사한 기능을 가진 브라우저 기반 셸도 제공합니다. 일부 HDInsight 클러스터는 Zeppelin Notebook으로 미리 구성됩니다. 그러나 HDInsight 대화형 쿼리 (Apache Hive LLAP라고도 함) 클러스터를 사용하는 경우 Zeppelin 은 대화형 Hive 쿼리를 실행하는 데 사용할 수 있는 유일한 Notebook입니다. 또한 도메인에 가입된 HDInsight 클러스터를 사용하는 경우 Zeppelin Notebook은 다른 사용자 로그인을 할당하여 Notebook 및 기본 Hive 테이블에 대한 액세스를 제어할 수 있는 유일한 유형의 Notebook입니다.

VS Code에서 Jupyter 노트북

VS Code는 로컬로 사용하거나 원격 컴퓨팅에 연결할 수 있는 무료 코드 편집기 및 개발 플랫폼입니다. Jupyter 확장과 함께 VS Code를 사용하는 경우 더 많은 언어 확장으로 향상될 수 있는 Jupyter 개발을 위한 완전히 통합된 환경을 제공합니다. 동급 최고의 무료 Jupyter 환경을 원하고 선택한 컴퓨팅을 사용할 수 있도록 하려면 이 옵션을 선택합니다.

VS Code를 사용하면 원격 및 컨테이너에 대해 Notebook을 개발하고 실행할 수 있습니다. Azure Notebook에서의 전환을 간소화하기 위해 VS Code와 함께 사용할 수 있는 컨테이너 이미지도 제공됩니다.

Jupyter(이전의 IPython Notebook)는 Notebook이라는 하나의 캔버스에서 Markdown 텍스트와 실행 가능한 Python 소스 코드를 쉽게 결합할 수 있는 오픈 소스 프로젝트입니다. VS Code는 기본적으로 Python 코드 파일을 통해 Jupyter Notebook 작업을 지원합니다.

주요 선택 조건

다음 질문에 답변하여 선택 범위를 좁히기 시작합니다.

  • 수많은 데이터 원본에 연결하고 중앙 집중식 위치를 제공하여 도메인 전체에 분산된 데이터에 대한 보고서를 만들어야 하나요? 이 경우 수백 개의 데이터 원본에 연결할 수 있는 옵션을 선택합니다.

  • 외부 웹 사이트 또는 애플리케이션에 동적 시각화를 포함하려고 하나요? 이 경우 포함 기능을 제공하는 옵션을 선택합니다.

  • 오프라인 상태에서 시각화 및 보고서를 디자인하려고 하나요? 이 경우 오프라인 기능이 있는 옵션을 선택합니다.

  • 대규모 또는 복잡한 AI 모델을 학습하거나 큰 데이터 집합으로 작업하려면 처리 능력이 많이 필요합니까? 이 경우 빅 데이터 클러스터에 연결할 수 있는 옵션을 선택합니다.

기능 매트릭스

다음 표에는 기능의 주요 차이점이 요약되어 있습니다.

일반 기능

능력 Power BI Jupyter 노트북 Zeppelin Notebooks VS Code에서 Jupyter 노트북
고급 처리를 위해 빅 데이터 클러스터에 연결 아니요
관리되는 서비스 1 1
수백 개의 데이터 원본에 연결 아니요 아니요 아니요
오프라인 기능 2 아니요 아니요 아니요
임베딩 기능 아니요 아니요 아니요
자동 데이터 새로 고침 아니요 아니요 아니요
수많은 오픈 소스 패키지에 대한 액세스 아니요 3 3 4
데이터 변환 또는 정리 옵션 파워 쿼리, R 40개 언어(Python, R, Julia 및 Scala 포함) Python, JDBC 및 R을 포함하여 20개 이상의 인터프리터 Python, F#, R
가격 책정 Power BI Desktop(작성)에는 무료입니다. 호스팅 옵션은 Power BI 가격 책정 을 참조하세요. 무료 무료 무료
다중 사용자 협업 예(공유 또는 JupyterHub와 같은 다중 사용자 서버 사용) 예(공유를 통해)

[1] 관리되는 HDInsight 클러스터의 일부로 사용되는 경우

[2] Power BI Desktop을 사용하여

[3] Maven 리포지토리 에서 커뮤니티 기여 패키지를 검색할 수 있습니다.

[4] pip 또는 Conda를 사용하여 Python 패키지를 설치할 수 있습니다. CRAN 또는 GitHub에서 R 패키지를 설치할 수 있습니다. Paket 종속성 관리자를 사용하여 nuget.org 통해 F#에 패키지를 설치할 수 있습니다.

기여자

Microsoft는 이 문서를 유지 관리합니다. 다음 기여자는 이 문서를 작성했습니다.

주요 작성자:

LinkedIn 비공개 프로필을 보려면, LinkedIn에 로그인하세요.

다음 단계