このページでは、サーバーレス ワークスペース (プライベート プレビュー) で既定のストレージを使用する方法について説明します。
既定のストレージは、Unity カタログ カタログのフル マネージド ストレージの場所を提供します。これにより、ストレージ資格情報や Unity カタログ上の外部の場所を構成せずに、マネージド テーブルとボリュームを作成できます。
サーバーレス ワークスペースのプライベート プレビューを有効にしている場合は、既定のストレージに基づく新しいカタログを既存の Unity カタログ対応ワークスペースに追加できます。
要求事項
既定のストレージは、サーバーレス ワークスペースでのみ使用できます。これは、高速セットアップで作成された Databricks アカウント、またはサーバーレス ワークスペースのプライベート プレビューに対して有効になっているアカウントでのみ使用できます。
既定のストレージを使用してカタログを作成する
注
既定では、既定のストレージを使用するカタログには、作成されたワークスペースからのみアクセスできます。 他のワークスペースにアクセス権を付与することはできますが、カタログ内のデータにアクセスするにはサーバーレス コンピューティングを使用する必要があります。 特定のワークスペースへのカタログ アクセスの制限を参照してください。
既定のストレージを使用してカタログを作成するには、 CREATE CATALOG
特権が必要です。 「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
既定のストレージを使用して新しいカタログを作成するには、次の手順を実行します。
- [
サイドバーのカタログ。 カタログ エクスプローラーが表示されます。
- カタログを作成 をクリックします。 [ 新しいカタログの作成 ] ダイアログが表示されます。
- アカウントで一意の カタログ名 を指定します。
- [既定のストレージを使用する] オプションを選択します。
- Create をクリックしてください。
サーバーレス ワークスペースでは、次の SQL コマンドを使用して、既定のストレージに新しいカタログを作成することもできます。 カタログの場所を指定する必要はありません。
CREATE CATALOG [ IF NOT EXISTS ] catalog_name
[ COMMENT comment ]
既定のストレージを操作する
既定のストレージとのやり取りには、サーバーレスの Unity カタログ対応コンピューティングが必要です。
既定のストレージでサポートされるリソースでは、Unity カタログ内の他のオブジェクトと同じ特権モデルが使用されます。 データ オブジェクトを作成、表示、クエリ、または変更するための十分な権限が必要です。 「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
既定のストレージを使用するには、既定のストレージでバックアップされたマネージド テーブルとマネージド ボリュームを作成して操作します。 Delta Lake と Apache Iceberg の Azure Databricks の Unity カタログマネージド テーブルとUnity カタログ ボリュームとは何かを参照してください。
カタログ エクスプローラー、ノートブック、SQL エディター、ダッシュボードを使用して、既定のストレージに格納されているデータ オブジェクトを操作できます。
タスクの例
既定のストレージで完了できるタスクの例を次に示します。
- ローカル ファイルをマネージド ボリュームにアップロードするか、マネージド テーブルを作成します。 「Unity カタログ ボリュームにファイルをアップロードする」および「ファイルのアップロードを使用してテーブルを作成または変更する」を参照してください。
- ノートブックを使用してデータのクエリを実行します。 「チュートリアル: ノートブックからのデータのクエリと視覚化」を参照してください。
- ダッシュボードを作成します。 「ダッシュボードの作成」を参照してください。
- SQL を使用してデータを照会し、SQL クエリをスケジュールします。 新しい SQL エディターでのクエリの書き込みとデータの探索を参照してください。
- 外部ボリュームからマネージド テーブルにデータを取り込みます。 Unity カタログでの自動ローダーの使用を参照してください。
- Fivetran を使用してマネージド テーブルにデータを取り込みます。 Fivetran への接続を参照してください。
- BI ツールを使用してマネージド テーブルを探索します。 「Azure Databricks を使用して Tableau と Azure Databricks と Power BI を接続する」を参照してください。
- サーバーレス ノートブックを実行します。 「ノートブックのサーバーレス コンピューティング」をご覧ください。
- サーバーレス ジョブを実行します。 ワークフローのサーバーレス コンピューティングを使用した Lakeflow ジョブの実行を参照してください。
- エンドポイントを提供するモデルを実行します。 「モザイク AI モデル サービスを使用してモデルをデプロイする」を参照してください。
- サーバーレスの Lakeflow 宣言パイプラインを実行します。 サーバーレス パイプラインの構成を参照してください。
- テーブルで予測最適化を使用します。 「Unity Catalog 管理テーブルの予測最適化」を参照してください。
制限事項
次の制限事項が適用されます。
- クラシック コンピューティング (サーバーレスではないコンピューティング) は、既定のストレージ内のデータ資産と対話できません。
- 差分共有では、任意の受信者 (開いているまたは Azure Databricks) へのテーブルの共有がサポートされており、受信者はクラシック コンピューティングを使用して共有テーブル (ベータ) にアクセスできます。 アカウント コンソールで、 既定のストレージ - 拡張アクセス機能の差分共有 を有効にします。
- この機能は、
southcentralus
、uksouth
、westus2
の各リージョンではサポートされていません。
- この機能は、
- 他のすべての共有可能なリソースは、同じリージョン内の Azure Databricks 受信者と Delta共有できる。 受信者はサーバーレス コンピューティングを使用する必要があります。
- パーティション分割が有効になっているテーブルを差分共有にすることはできません。
- 外部リーダーとライターは、既定のストレージにアクセスできません。
-
CREATE CATALOG catalog_name
SQL コマンドを使用して、既定のストレージに新しいカタログを作成することはできません。 - フロントエンド Private Link は、既定のストレージでは完全にはサポートされていません。 外部クライアントからのクラウド フェッチなどの機能はサポートされていません。