다음을 통해 공유


파이프라인을 사용하여 웨어하우스로 데이터 수집

적용 대상: Microsoft Fabric의✅ Warehouse

파이프라인은 그래픽 사용자 인터페이스를 통해 COPY 명령을 사용하는 대신 사용할 수 있습니다. 파이프라인은 데이터 수집 작업을 함께 수행하는 작업의 논리적 그룹화입니다. 파이프라인을 사용하면 각 작업을 개별적으로 관리하는 대신 ETL(추출, 변환 및 로드) 작업을 관리할 수 있습니다.

이 자습서에서는 샘플 데이터를 Microsoft Fabric의 웨어하우스에 로드하는 새 파이프라인을 만듭니다.

Note

Azure Data Factory의 일부 기능은 Microsoft Fabric에서 사용할 수 없지만 개념은 서로 교환할 수 있습니다. Azure Data Factory 및 Azure Synapse Analytics의 파이프라인과 활동에 대해 Pipelines and activities in Azure Data Factory and Azure Synapse Analytics에서 자세히 알아볼 수 있습니다. 빠른 시작을 위해 빠른 시작: 데이터 복사를 위한 첫 번째 파이프라인 만들기를 방문하세요.

파이프라인 만들기

  1. 새 파이프라인을 만들려면 작업 영역으로 이동하여 +새로 만들기 단추를 선택하고 파이프라인을 선택합니다. 데이터 가져오기 섹션 아래의 새 항목 단추를 보여 주는 사용자 작업 영역의 위쪽 섹션 스크린샷 파이프라인 단추가 강조 표시됩니다.

  2. 새 파이프라인을 만들려면 작업 영역으로 이동하여 + 새 항목 단추를 선택하고 파이프라인을 선택합니다.

    • 작업 영역에서 + 새 항목을 선택하고 데이터 가져오기 섹션에서 파이프라인 카드를 찾습니다.
    • 또는 탐색 창에서 만들기 를 선택합니다. Data Factory 섹션에서 파이프라인 카드를 찾습니다.
  3. 새 파이프라인 대화 상자에서 새 파이프라인의 이름을 제공하고 만들기를 선택합니다.

  4. 시작 옵션이 표시되는 파이프라인 캔버스 영역에 도착합니다.

    수집을 시작하기 위해 선택할 수 있는 세 가지 옵션을 보여 주는 스크린샷

    데이터 복사 도우미 옵션을 선택하여 복사 도우미를 시작합니다.

  5. 데이터 복사 도우미의 첫 번째 페이지는 다양한 데이터 원본에서 사용자 고유의 데이터를 선택하거나 제공된 샘플 중 하나를 선택하여 시작하는 데 도움이 됩니다. 이 페이지 상단의 메뉴 모음에서 샘플 데이터을 선택하세요. 이 자습서에서는 COVID-19 Data Lake 샘플을 사용합니다. 이 옵션을 선택하고 다음을 선택합니다.

    샘플 데이터 또는 기타 데이터 원본을 사용하기 위한 선택 항목을 보여 주는 스크린샷

  6. 다음 페이지에서 데이터 세트, 원본 파일 형식을 선택하고 선택한 데이터 세트를 미리 볼 수 있습니다. CSV 형식인 Bing COVID-19를 선택하고 다음을 선택합니다.

    COVID-19 샘플, 파일 형식 및 데이터의 미리 보기를 보여 주는 그리드에 대한 다양한 데이터 세트 옵션을 보여 주는 스크린샷

  7. 다음 페이지인 데이터 대상을 사용하면 대상 작업 영역의 형식을 구성할 수 있습니다. 작업 영역의 웨어하우스에 데이터를 로드합니다. 드롭다운 목록에서 원하는 웨어하우스를 선택하고 다음을 선택합니다.

  8. 대상을 구성하는 마지막 단계는 대상 테이블에 이름을 제공하고 열 매핑을 구성하는 것입니다. 여기에서 데이터를 새 테이블 또는 기존 테이블로 로드하거나, 스키마 및 테이블 이름을 제공하고, 열 이름을 변경하거나, 열을 제거하거나, 매핑을 변경할 수 있습니다. 기본값을 수용하거나 사용자 취향에 맞게 설정을 조정할 수 있습니다.

    기존 테이블에 데이터를 로드하거나 새 테이블을 만드는 옵션을 보여 주는 스크린샷

    옵션 검토를 마쳤으면 다음을 선택합니다.

  9. 다음 페이지에서는 스테이징을 사용할 옵션이나 T-SQL COPY 명령을 사용하는 데이터 복사 작업에 대한 고급 옵션을 제공합니다. 옵션을 변경하지 않고 검토한 후 다음선택합니다.

  10. 어시스턴트의 마지막 페이지에서 복사 작업 요약을 제공합니다. 즉시 데이터 전송 시작 옵션을 선택하고 저장 + 실행을 선택합니다.

    데이터 전송 작업을 즉시 시작하는 옵션과 뒤로 및 저장 + 실행 단추를 보여 주는 스크린샷.

  11. 파이프라인 캔버스 영역으로 안내되어 새로 구성된 데이터 복사 작업을 확인할 수 있습니다. 파이프라인이 자동으로 실행되도록 시작합니다. 출력 창에서 파이프라인의 상태를 모니터링할 수 있습니다.

    가운데에 복사 작업이 있는 파이프라인 캔버스와 진행 중인 현재 상태를 보여 주는 파이프라인 실행 상태를 보여 주는 스크린샷.

  12. 몇 초 후에 파이프라인이 성공적으로 완료됩니다. 웨어하우스로 돌아가서 테이블을 선택하여 데이터를 미리 확인하고 복사 작업이 완료되었음을 확인할 수 있습니다.

Microsoft Fabric의 Warehouse로 데이터 수집에 대한 자세한 내용은 다음을 참조하세요.

다음 단계