다음을 통해 공유


Databricks Notebook 및 SQL 편집기에서 시각화

Azure Databricks에는 Notebook 또는 SQL 편집기를 사용할 때 데이터에서 직접 차트 및 시각화를 만드는 강력한 기본 제공 도구가 있습니다. 이 페이지에서는 Notebook 및 SQL 편집기에서 시각화를 만들고, 편집하고, 관리하는 방법을 설명합니다. AI/BI 대시보드의 시각화에 대한 자세한 내용은 대시보드 시각화를 참조하세요.

Notebook 또는 SQL 편집기에서 만들 수 있는 시각화 유형을 보려면 시각화 유형을 참조하세요.

시각화할 결과 집합 생성

이 페이지에서 사용되는 결과 집합을 생성하려면 다음 코드를 사용합니다.

SQL

SQL 편집기에서 다음 쿼리를 실행합니다.

USE CATALOG samples;
   SELECT
      hour(tpep_dropoff_datetime) as dropoff_hour,
      COUNT(*) AS num
   FROM samples.nyctaxi.trips
   WHERE pickup_zip in ['10001', '10002']
   GROUP BY 1;

파이썬

Notebook의 Python 셀에서 다음 코드를 실행합니다.

from pyspark.sql.functions import hour, col

pickupzip = '10001'  # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
              .groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
              .count() \
              .withColumnRenamed("count", "num")
display(result_df)

새 시각화 만들기

결과 테이블이 표시되는 동일한 UI에서 시각화를 만들 수 있습니다. Notebook에서 작업하는 경우 데이터 프레임 및 테이블에 대한 요약 통계 및 시각적 인사이트를 제공하는 데이터 프로필을 생성할 수도 있습니다. 데이터 프로필에 대한 자세한 내용은 데이터 프로필 생성을 참조하세요.

  1. 시각화를 만들려면 결과 위에서 클릭하고 +시각화 를 선택하여 시각화 편집기를 엽니다.

    SQL 편집기

    시각화 옵션이 표시된 SQL 편집기 결과 테이블입니다.

    노트북

    시각화 옵션이 표시된 Notebook 결과 테이블입니다.

  2. Visualization Type(시각화 형식) 드롭다운에서 형식을 선택합니다. 그런 다음 시각화에 표시할 데이터를 선택합니다. 시각화 편집기

  3. 구성을 선택한 후 저장을 클릭합니다.

시각화 제거, 복제 또는 편집

시각화 또는 데이터 프로필을 제거, 복제 또는 편집하려면 탭 이름 오른쪽에 있는 아래쪽 화살표를 클릭합니다. 메뉴에서 대시보드를 만들 수도 있습니다.

참고 항목

셀에 데이터 프로필이 포함되어 있거나 SQL 이외의 언어를 실행하는 경우 연결된 시각화 및 데이터 프로필은 Notebook 대시보드에만 추가할 수 있습니다. SQL 셀의 경우 드롭다운에 대시보드에 추가 메뉴 항목이 추가됩니다. 을(를) 참조하여 대시보드에 시각화를 추가하세요.

SQL 편집기

SQL 편집기에서 시각화 메뉴 옵션입니다.

노트북

Notebook의 시각화 메뉴 옵션입니다.

이름을 직접 클릭하고 현재 위치에서 이름을 편집하여 탭의 이름을 바꿀 수도 있습니다.

시각화 편집

시각화를 편집하려면 다음을 수행합니다.

  1. 시각화 탭에서 아래쪽 화살표를 클릭합니다. 그런 다음 편집클릭합니다.
  2. 시각화 편집기 탭을 사용하여 차트의 여러 부분에 액세스하고 편집할 수 있습니다.

시각화 필터링

시각화에 필터를 적용하려면 필터 아이콘 을 클릭합니다. 오른쪽 위 모서리에 적용할 필터 조건을 입력합니다.

시각화에 적용된 필터도 결과 테이블에 적용됩니다. 결과 테이블에 적용된 필터도 시각화에 적용됩니다.

시각화에 필터를 적용하면 결과 테이블도 필터링됩니다.

시각화 복제

시각화를 복제하려면 시각화 탭에서 아래쪽 화살표를 클릭합니다. 그런 다음 중복을 클릭합니다.

시각화에서 집계 사용

막대형 차트, 선형 차트, 영역형 차트, 원형 차트 및 열 지도 차트의 경우, 쿼리에 집계 열을 추가하여 수정하는 대신 시각화에서 직접 집계를 추가합니다. 이 접근 방식에는 다음과 같은 장점이 있습니다.

  • 결과 테이블을 생성하는 코드를 수정할 필요가 없습니다.
  • 집계를 수정하면 시나리오 기반 데이터 분석을 신속하게 수행할 수 있습니다.
  • 집계는 테이블에 표시된 처음 64,000개의 행뿐만 아니라 전체 데이터 세트에 적용됩니다.

집계는 다음과 같은 시각화에서 사용할 수 있습니다.

  • 술집
  • 지역
  • 파이
  • 히트맵
  • 히스토그램

집계에서는 동일한 차트에 선과 막대를 표시하는 것과 같은 조합 시각화를 지원하지 않습니다.

시각화에 대한 Y축 열을 집계하려면 다음을 수행합니다.

  1. 새 차트를 만들거나 기존 차트를 편집하여 시각화 편집기를 엽니다. This visualization uses an old configuration. New visualizations support aggregating data directly within the editor 메시지가 표시되는 경우 시각화를 다시 만들어야만 집계를 사용할 수 있습니다.

  2. Y축 열 옆에서 숫자 형식에 대해 다음에서 집계 형식을 선택하세요.

    • 합계(기본값)
    • 평균
    • 수량
    • Count Distinct
    • 맥스
    • 중앙값

    또는 문자열 형식에 대해 다음 중에서 선택합니다.

    • 수량
    • Count Distinct
  3. 저장을 클릭합니다. 시각화는 집계하는 행 수를 보여 줍니다.

경우에 따라 Y축 열에서 집계를 사용하지 않을 수 있습니다. 집계를 해제하려면 kebab 메뉴 Kebab 메뉴 아이콘 을 클릭합니다. Y 열 옆에 있는 집계 사용 선택을 취소합니다.

시각화 색 편집

시각화를 만들거나 편집하여 시각화의 색을 사용자 지정할 수 있습니다.

  1. 시각화를 만들거나 편집합니다.
  2. 을 클릭합니다.
  3. 색을 수정하려면 사각형을 클릭하고 다음 중 하나를 수행하여 새 색을 선택합니다.
    • 색 선택기에서 색을 클릭합니다.
    • 16진수 값을 입력합니다.
  4. 색 선택기 외부의 아무 곳이나 클릭하여 닫습니다.
  5. 저장시각화 편집기에서 클릭하여 변경 내용을 저장합니다.

시리즈를 일시적으로 숨기거나 표시

시각화에서 계열을 숨기려면 범례에서 계열을 클릭합니다. 계열을 다시 표시하려면 범례에서 다시 클릭합니다.

하나의 계열만 표시하려면 범례에서 계열을 두 번 클릭합니다. 다른 계열을 표시하려면 각 계열을 클릭합니다.

계열 선택

차트에서 분석할 특정 계열을 선택하려면 다음 명령을 사용합니다.

  • 범례 항목 하나를 클릭하여 해당 계열을 선택하세요.
  • Cmd/Ctrl 키를 누르고 범례 항목을 클릭하여 여러 계열을 선택하거나 선택 취소하세요.

계열 선택

정렬된 툴팁

보다 쉽게 분석할 수 있도록, 크기순으로 정렬된 꺾은선형 차트와 정렬되지 않은 세로 막대형 차트에 도구 설명을 사용합니다.

정렬된 도구 설명

데이터 밀도가 높은 차트의 경우 개별 데이터 요소를 확대하면 세부 정보를 조사하고 이상값을 자르는 데 도움이 될 수 있습니다. 차트를 확대하려면 캔버스를 클릭하고 끌어옵니다. 확대/축소를 지우려면 캔버스를 마우스로 가리키고 시각화의 오른쪽 위 모서리에 있는 확대/축소 지우기 단추를 클릭합니다.

확대하여 세부 정보 확인

PNG 파일로 시각화 다운로드

시각화를 PNG 파일로 다우로드하려면 캔버스를 마우스로 가리키고 오른쪽 위 모서리에 있는 다운로드 아이콘을 클릭합니다.

시각화를 PNG 파일로 내보내려면 다운로드를 클릭하세요

png 파일이 디바이스에 다운로드됩니다.

대시보드에 시각화 추가

  1. 탭 이름 오른쪽에 있는 아래쪽 화살표를 클릭합니다.
  2. 대시보드에 추가을 선택합니다. 사용 가능한 대시보드 보기 목록과 함께 새 대시보드에 추가 메뉴 옵션이 표시됩니다.
  3. 대시보드를 선택하거나 새 대시보드에 추가을 선택합니다. 새로 추가된 시각화를 포함하여 대시보드가 나타납니다.

전통적인 시각화

최신 버전의 차트 시각화는 기본적으로 설정됩니다. 이 섹션의 설정에서는 이전 차트로 작업하거나 최신 버전이 꺼져 있는 경우 발생할 수 있는 레거시 시각화에 대해 설명합니다.

시각화 도구

시각화 편집기에서 차트의 오른쪽 위 모서리에 마우스를 가져가면 선택, 확대/축소 및 이동과 같은 작업을 수행할 수 있는 Plotly 도구 모음이 나타납니다.

플롯 도구 모음

도구 모음이 보이지 않는 경우, 관리자가 도구 모음 표시를 사용 중지로 설정했기 때문입니다.

사용자 지정 색상표

참고 항목

기본적으로 레거시 대시보드에서 사용자 지정 색상표를 사용하는 경우 시각화 색 선택은 무시됩니다. 이 설정을 재정의하려면 시각화에 다른 색 팔라테 사용을 참조하세요.