적용 대상: Azure Data Factory
Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아보세요!
이 문서에서는 Azure Data Factory 및 Synapse Analytics 파이프라인에서 복사 작업을 사용하여 Google BigQuery에서 데이터를 복사하는 방법을 간략하게 설명합니다. 이 문서는 복사 작업에 대한 일반적인 개요를 제공하는 복사 작업 개요 문서를 기반으로 합니다.
중요합니다
Google BigQuery V2 커넥터는 개선된 네이티브 Google BigQuery 지원을 제공합니다. 솔루션에서 Google BigQuery V1 커넥터를 사용하는 경우 V1이 지원 종료 단계에 있으므로 Google BigQuery 커넥터를 업그레이드하세요. 업그레이드하지 않으면 2025년 9월 30 일 이후에 파이프라인이 실패합니다. V2와 V1의 차이점에 대한 자세한 내용은 이 섹션을 참조하세요.
지원되는 기능
이 Google BigQuery 커넥터는 다음 기능을 지원합니다.
지원되는 기능 | 적외선 |
---|---|
복사 작업(원본/-) | ① ② |
조회 작업 | ① ② |
① Azure Integration Runtime ② 자체 호스팅 통합 런타임
복사 작업의 원본 또는 싱크로 지원되는 데이터 저장소 목록은 지원되는 데이터 저장소 표를 참조하세요.
이 서비스는 연결을 사용하도록 설정하는 기본 제공 드라이버를 제공합니다. 따라서 이 커넥터를 사용하기 위해 드라이버를 수동으로 설치할 필요가 없습니다.
참고
Google BigQuery 커넥터는 BigQuery API를 기반으로 구축되었습니다. 단, BigQuery는 최대 수신 요청 비율을 제한하고 프로젝트 단위로 적절한 할당량을 강제 적용합니다. 자세한 내용은 할당량 및 제한 - API 요청을 참조하세요. 계정에 너무 많은 동시 요청을 트리거하지 않도록 하세요.
시작하기
파이프라인에 복사 작업을 수행하려면 다음 도구 또는 SDK 중 하나를 사용하면 됩니다.
UI를 사용하여 Google BigQuery에 연결된 서비스 만들기
다음 단계를 사용하여 Azure Portal UI에서 Google BigQuery에 연결된 서비스를 만듭니다.
Azure Data Factory 또는 Synapse 작업 영역에서 관리 탭으로 이동하고 연결된 서비스를 선택한 다음 새로 만들기를 클릭합니다.
Google BigQuery를 쿼리하고 커넥터를 선택합니다.
서비스 세부 정보를 구성하고 연결을 테스트하고 새 연결된 서비스를 만듭니다.
커넥터 구성 세부 정보
다음 섹션에서는 Google BigQuery 커넥터와 관련된 항목을 정의하기 위해 사용되는 속성에 대한 세부 정보를 살펴봅니다.
연결된 서비스 속성
다음은 Google BigQuery 연결된 서비스에 대해 지원되는 속성입니다.
속성 | 설명 | 필수 |
---|---|---|
유형 | type 속성은 GoogleBigQueryV2로 설정해야 합니다. | 예 |
버전 | 지정한 버전입니다. 최신 향상된 기능을 활용하려면 최신 버전으로 업그레이드하는 것이 좋습니다. | 버전 1.1의 경우 예 |
projectId | 쿼리할 기본 BigQuery 프로젝트의 프로젝트 ID입니다. | 예 |
인증유형 | 인증에 사용되는 OAuth 2.0 인증 메커니즘입니다. 허용되는 값은 UserAuthentication 및 ServiceAuthentication입니다. 각 인증 형식에 대한 더 많은 속성 및 JSON 샘플은 표 아래 섹션을 참조하세요. |
예 |
사용자 인증 사용
“authenticationType” 속성을 UserAuthentication으로 설정하고, 이전 섹션에서 설명한 일반 속성과 함께 다음 속성을 지정합니다.
속성 | 설명 | 필수 |
---|---|---|
clientId | 새로 고침 토큰을 생성하는 데 사용되는 애플리케이션의 ID입니다. | 예 |
클라이언트시크릿 | 새로 고침 토큰을 생성하는 데 사용되는 애플리케이션의 비밀입니다. 이 필드를 SecureString으로 표시하여 안전하게 저장하거나, Azure Key Vault에 저장된 비밀을 참조합니다. | 예 |
refreshToken | BigQuery에 대한 액세스 권한을 부여하는 데 사용되는 Google에서 가져온 새로 고침 토큰입니다. OAuth 2.0 액세스 토큰 가져오기 및 이 커뮤니티 블로그에서 토큰을 가져오는 방법을 알아보세요. 이 필드를 SecureString으로 표시하여 안전하게 저장하거나, Azure Key Vault에 저장된 비밀을 참조합니다. | 예 |
예:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQueryV2",
"version": "1.1",
"typeProperties": {
"projectId" : "<project ID>",
"authenticationType" : "UserAuthentication",
"clientId": "<client ID>",
"clientSecret": {
"type": "SecureString",
"value":"<client secret>"
},
"refreshToken": {
"type": "SecureString",
"value": "<refresh token>"
}
}
}
}
서비스 인증 사용
“authenticationType” 속성을 ServiceAuthentication으로 설정하고, 이전 섹션에서 설명한 일반 속성과 함께 다음 속성을 지정합니다.
속성 | 설명 | 필수 |
---|---|---|
keyFileContent | 서비스 계정을 인증하는 데 사용되는 JSON 형식의 키 파일입니다. 이 필드를 SecureString으로 표시하여 안전하게 저장하거나, Azure Key Vault에 저장된 비밀을 참조합니다. | 예 |
예:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQueryV2",
"version": "1.1",
"typeProperties": {
"projectId": "<project ID>",
"authenticationType": "ServiceAuthentication",
"keyFileContent": {
"type": "SecureString",
"value": "<key file JSON string>"
}
}
}
}
데이터 세트 속성
데이터 세트 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 데이터 세트 문서를 참조하세요. 이 섹션에서는 Google BigQuery 데이터 세트에서 지원하는 속성의 목록을 제공합니다.
Google BigQuery에서 데이터를 복사하려면 데이터 세트의 type 속성을 GoogleBigQueryV2Object로 설정합니다. 다음과 같은 속성이 지원됩니다.
속성 | 설명 | 필수 |
---|---|---|
유형 | 데이터 세트의 형식 속성은 GoogleBigQueryV2Object로 설정되어야 합니다. | 예 |
데이터 세트 | Google BigQuery 데이터 세트의 이름입니다. | 아니요(작업 원본에서 "query"가 지정된 경우) |
테이블 | 테이블 이름입니다. | 아니요(작업 원본에서 "query"가 지정된 경우) |
예제
{
"name": "GoogleBigQueryDataset",
"properties": {
"type": "GoogleBigQueryV2Object",
"linkedServiceName": {
"referenceName": "<Google BigQuery linked service name>",
"type": "LinkedServiceReference"
},
"schema": [],
"typeProperties": {
"dataset": "<dataset name>",
"table": "<table name>"
}
}
}
복사 작업 속성
작업 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 파이프라인 문서를 참조하세요. 이 섹션에서는 Google BigQuery 원본 형식에서 지원하는 속성의 목록을 제공합니다.
원본 형식인 GoogleBigQuerySource
Google BigQuery에서 데이터를 복사하려면 복사 작업의 원본 형식을 GoogleBigQueryV2Source로 설정합니다. 복사 작업 source 섹션에서 다음 속성이 지원됩니다.
속성 | 설명 | 필수 |
---|---|---|
유형 | 복사 작업 원본의 형식 속성은 GoogleBigQueryV2Source로 설정되어야 합니다. | 예 |
문의 | 사용자 지정 SQL 쿼리를 사용하여 데이터를 읽습니다. 예제는 "SELECT * FROM MyTable" 입니다. 자세한 내용은 쿼리 구문을 참조하세요. |
아니요(데이터 세트의 "데이터 세트" 및 "테이블"이 지정된 경우) |
예:
"activities":[
{
"name": "CopyFromGoogleBigQuery",
"type": "Copy",
"inputs": [
{
"referenceName": "<Google BigQuery input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "GoogleBigQueryV2Source",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
조회 작업 속성
속성에 대한 자세한 내용을 보려면 조회 작업을 확인하세요.
Google BigQuery 커넥터 수명 주기 및 업그레이드
다음 표에서는 다양한 버전의 Google BigQuery 커넥터에 대한 릴리스 단계 및 변경 로그를 보여 줍니다.
버전 | 릴리스 단계 | 변경사항 기록 |
---|---|---|
Google BigQuery V1 | 지원 종료 | / |
Google BigQuery V2(버전 1.0) | GA 버전 사용 가능 | • 서비스 인증은 Azure 통합 런타임 및 자체 호스팅 통합 런타임에서 지원됩니다. 속성 trustedCertPath useSystemTrustStore email keyFilePath 은 자체 호스팅 통합 런타임에서만 사용할 수 있으므로 지원되지 않습니다. • requestGoogleDriveScope 지원되지 않습니다. Google 드라이브 API 범위 선택 및 드라이브 데이터 쿼리를 참고하여 Google BigQuery 서비스에서 권한을 추가로 적용해야 합니다. • additionalProjects 지원되지 않습니다. 대안으로, Google Cloud 콘솔을 사용하여 공용 데이터 세트를 쿼리합니다.• NUMBER는 10진수 데이터 형식으로 읽습니다. • 타임스탬프 및 Datetime은 DateTimeOffset 데이터 형식으로 읽습니다. |
Google BigQuery V2(버전 1.1) | GA 버전 사용 가능 | • 버그 수정: 여러 문을 query 실행할 때 이제는 항상 첫 번째 문의 결과를 반환하지 않고 평가 문을 제외한 후 첫 번째 문의 결과를 반환합니다. |
Google BigQuery 커넥터 업그레이드
Google BigQuery 커넥터를 업그레이드하려면 다음을 수행합니다.
V1에서 V2까지:
새 Google BigQuery 연결된 서비스를 만들고 연결된 서비스 속성을 참조하여 구성합니다.V2 버전 1.0에서 버전 1.1까지:
연결된 서비스 편집 페이지에서 버전에 대해 1.1을 선택합니다. 자세한 내용은 연결된 서비스 속성을 참조하세요.
관련 콘텐츠
복사 작업에서 원본 및 싱크로 지원되는 데이터 저장소 목록은 지원되는 데이터 저장소를 참조하세요.