Azure Storage からデータを取得する

2025-05-20

この記事では、Azure Storage (ADLS Gen2 コンテナー、BLOB コンテナー、または個々の BLOB) からデータを取得する方法について説明します。データは、継続的に、または 1 回限りのインジェストとしてテーブルに取り込むことができます。取り込まれると、データはクエリで使用できるようになります。

継続的インジェスト (プレビュー): 継続的インジェストには、Eventhouse が Azure Storage イベントをリッスンできるようにするインジェストパイプラインの設定が含まれます。パイプラインは、サブスクライブされたイベントが発生したときに情報を引き出すようにイベントハウスに知らせます。イベントは BlobCreated と BlobRenamed です。

Von Bedeutung

この機能はプレビュー段階です。

手記

継続的インジェストストリームは、課金に影響する可能性があります。詳細については、「 Eventhouse と KQL Database の使用」を参照してください。
1 回限りインジェスト: このメソッドを使用して、1 回限りの操作として Azure Storage からデータを取得します。

前提条件

Microsoft Fabric 対応の容量を持つワークスペース。
編集アクセス許可を持つ KQL データベース。
ストレージアカウント。

継続的な取り込みには、次のものも必要です。

ワークスペースのアイデンティティ。 マイワークスペース はサポートされていません。必要に応じて、新しいワークスペースを作成します。
ストレージアカウントで階層型名前空間を有効にします。
ワークスペース ID に割り当てられたストレージ BLOB データ閲覧者ロールのアクセス許可。
データファイルを保持するコンテナー。
コンテナーにアップロードされたデータファイル。データファイル構造は、テーブルスキーマの定義に使用されます。詳細については、「Real-Time Intelligence でサポートされるデータ形式の」を参照してください。
手記

データファイルをアップロードする必要があります。
- セットアップ中にテーブルスキーマを定義する構成の前。
- 継続的インジェストをトリガーする構成の後、データをプレビューし、接続を確認します。

ワークスペース ID ロールの割り当てをストレージアカウントに追加する

Fabric のワークスペース設定から、ワークスペース ID をコピーします。
Azure portalでAzure Storage アカウントに移動し、アクセス制御 (IAM)を選択します。>追加>ロール割り当ての追加を選択します。
[ストレージ BLOB データリーダー] を選択します。
[ ロールの割り当ての追加 ] ダイアログで、[ + メンバーの選択] を選択します。
ワークスペース ID を貼り付け、アプリケーションを選択し、 Select>Review + assign を選択します。

データファイルを使用してコンテナーを作成する

ストレージアカウントで、[コンテナー] を選択 します。
[+ コンテナー] を選択し、コンテナーの名前を入力して [保存] を選択します。
コンテナーを入力し、[ アップロード] を選択して、前に準備したデータファイルをアップロードします。

詳細については、サポートされている形式とサポートされている圧縮を参照してください。
コンテキストメニュー [...] から[コンテナーのプロパティ] を選択し、構成中に入力する URL をコピーします。

ソース

データを取得するようにソースを設定します。

ワークスペースから EventHouse を開き、データベースを選択します。
KQL データベースリボンで、[データの取得] を選択します。
使用可能な一覧からデータソースを選択します。この例では Azure ストレージからデータを取り込もうとしています。

変換先テーブルを選択します。新しいテーブルにデータを取り込む場合は、+ 新しいテーブル を選択し、テーブル名を入力します。

手記

テーブル名には、スペース、英数字、ハイフン、アンダースコアを含む、最大 1024 文字を使用できます。特殊文字はサポートされていません。
[ Azure Blob Storage 接続の構成] で、 継続的インジェスト が有効になっていることを確認します。既定ではオンになっています。

新しい接続を作成するか、既存の接続を使用して接続を構成します。

新しい接続の作成:

[ ストレージアカウントに接続] を選択します。

フィールドの入力に次の説明を使用してください。

設定	フィールドの説明
サブスクリプション	ストレージアカウントサブスクリプション。
BLOB ストレージアカウント	ストレージアカウント名。
コンテナ	取り込むファイルを含むストレージコンテナー。

[接続] フィールドでドロップダウンを開き、[+ 新しい接続] を選択し、[>閉じる] を選択します。接続設定が事前に設定されています。

手記

新しい接続を作成すると、新しい Eventstream が生成されます。名前は<storate_account_name>_eventstreamとして定義されます。ワークスペースから継続的インジェストイベントストリームを削除しないようにしてください。

既存の接続を使用するには:

[ 既存のストレージアカウントの選択] を選択します。

フィールドの入力に次の説明を使用してください。

設定	フィールドの説明
RTAストレージアカウント	Fabric からストレージアカウントに接続されているイベントストリーム。
コンテナ	取り込むファイルを含むストレージコンテナー。
接続	これは接続文字列で事前に設定されています

[ 接続 ] フィールドでドロップダウンを開き、一覧から既存の接続文字列を選択します。 [ 保存]>[閉じる]を選択します。

必要に応じて、[ ファイルフィルター] を 展開し、次のフィルターを指定します。

設定	フィールドの説明
フォルダーパス	特定のフォルダーパスを使用してファイルを取り込むためのデータをフィルター処理します。
ファイル拡張子	特定のファイル拡張子のみを持つファイルを取り込むためのデータをフィルター処理します。

[ Eventstearm settings]\(Eventstearm 設定 \) セクションで、監視するイベントを [詳細設定>イベントの種類] で選択できます。既定では、Blob 作成が選択されています。 名前が変更された BLOB を選択することもできます。
[ 次へ ] を選択してデータをプレビューします。

変換先テーブルを選択します。新しいテーブルにデータを取り込む場合は、+ 新しいテーブル を選択し、テーブル名を入力します。

手記

テーブル名には、スペース、英数字、ハイフン、アンダースコアを含む、最大 1024 文字を使用できます。特殊文字はサポートされていません。
[ Azure Blob Storage 接続の構成] で、 継続的インジェスト がオフになっていることを確認します。既定ではオンになっています。

新しい接続を作成するには、新しい接続を作成するか、既存の接続を使用します。

新しい接続の作成:

[ ストレージアカウントに接続] を選択します。
フィールドの入力に次の説明を使用してください。

設定	フィールドの説明
サブスクリプション	ストレージアカウントが配置されているサブスクリプション名。
BLOB ストレージアカウント	ストレージアカウントを識別する名前。 Azure でアカウントの名前が変更された場合は、新しい名前を選択して接続を更新する必要があります。
コンテナ	取り込むファイルを含むストレージコンテナー。

既存のアカウントを接続するには:

SAS URL を使用して接続を作成するには、[ SAS URL を使用してストレージアカウントから取り込む] を選択します。

[SAS URL の入力] フィールドにストレージ接続文字列を貼り付け、+を選択します。

この文字列は、SAS トークンまたはアカウントキーを持つ BLOB URI で構成されます。次の表に、サポートされている認証方法と、Azure Storage からデータを取り込むのに必要なアクセス許可を示します。

認証方法	個々の BLOB	BLOB コンテナー	Azure Data Lake Storage Gen2
Shared Access (SAS) トークン	読み取りと書き込み	Read と List	Read と List
[ストレージアカウントアクセスキー](/azure/data-explorer/kusto/api/connection-strings/storage-connection-strings#storage-account-access-key?context=/fabric/ context/context#storage-account-access-key)

手記

最大 10 個の個々の BLOB を追加するか、1 つのコンテナーから最大 5,000 個の BLOB を取り込むことができます。両方を同時に取り込むことはありません。
各 BLOB は、圧縮されていない最大 1 GB にすることができます。

必要に応じて、[ ファイルフィルター] を 展開し、次のフィルターを指定します。

設定	フィールドの説明
フォルダーパス	特定のフォルダーパスを使用してファイルを取り込むためのデータをフィルター処理します。
ファイル拡張子	特定のファイル拡張子のみを持つファイルを取り込むためのデータをフィルター処理します。

[ 次へ ] を選択してデータをプレビューします。

検査する

[検査] タブが開き、データのプレビューが表示されます。

インジェストプロセスを完了するには、[完了]を選択します。

手記

継続的インジェストとプレビューデータを呼び出すには、構成後に新しいストレージ BLOB をアップロードしたことを確認します。

必要に応じて：

スキーマ定義ファイルのドロップダウンを使用して、スキーマが推論されるファイルを変更します。
[ファイルの種類] ドロップダウンを使用して、データ型に基づいて詳細オプションを確認します。
Table_mapping ドロップダウンを使用して、新しいマッピングを定義します。
</>を選択してコマンドビューアーを開き、入力から生成された自動コマンドを表示およびコピーします。クエリセットでコマンドを開くこともできます。
鉛筆アイコンを選択して列を編集します。

列の編集

手記

表形式 (CSV、TSV、PSV) の場合、列を 2 回マップすることはできません。既存の列にマップするには、最初に新しい列を削除します。
既存の列の種類を変更することはできません。別の形式の列にマップしようとすると、最終的に空の列になる可能性があります。

テーブルで行うことができる変更は、次のパラメーターによって異なります。

テーブル の種類 は新規または既存です。
マッピングの種類が新規かまたは既存か

テーブルの種類	マッピングの種類	使用可能な調整
新しいテーブル	新しいマッピング	列の名前変更、データ型の変更、データソースの変更、マッピング変換、列の追加、列の削除
既存のテーブル	新しいマッピング	列の追加 (データ型の変更、名前の変更、更新が可能)
既存のテーブル	既存のマッピング	何一つ

マッピング変換

一部のデータ形式マッピング (Parquet、JSON、Avro) では、単純な取り込み時間変換がサポートされています。マッピング変換を適用するには、[列の編集] ウィンドウで列作成または更新します。

マッピング変換は、データ型が int または long のソースを使用して、文字列型または datetime 型の列に対して実行できます。詳細については、サポートされているマッピング変換の完全な一覧を参照してください。

データ型に基づく詳細オプション

表形式データ (CSV、TSV、PSV):

表形式を既存のテーブルに取り込もうとしている場合は、詳細、>テーブルスキーマを保持するを選択できます。表形式データには、ソースデータを既存の列にマップするために使用される列名が必ずしも含まれているわけではありません。このオプションをオンにすると、マッピングは順番に行われ、テーブルスキーマは変わりません。このオプションをオフにすると、データ構造に関係なく、受信データに対して新しい列が作成されます。
表形式データには、ソースデータを既存の列にマップするために使用される列名が必ずしも含まれているわけではありません。最初の行を列名として使用するには、[最初の行を列ヘッダーにする] を選択します。

表形式データ (CSV、TSV、PSV):

既存のテーブルに表形式を取り込む場合は、Table_mapping>既存のスキーマを使用するを選択できます。表形式データには、ソースデータを既存の列にマップするために使用される列名が必ずしも含まれているわけではありません。このオプションをオンにすると、マッピングは順番に行われ、テーブルスキーマは変わりません。このオプションをオフにすると、データ構造に関係なく、受信データに対して新しい列が作成されます。
最初の行を列名として使用するには、[ 先頭行ヘッダー] を選択します。