次の方法で共有


Azure Machine Learning ワークスペースとは

ワークスペースは、同僚と共同作業を行い、機械学習成果物を作成し、関連作業をグループ化する場所です。 たとえば、実験、ジョブ、データセット、モデル、コンポーネント、推論エンドポイントなどです。 この記事では、ワークスペース、ワークスペースへのアクセスを管理する方法、およびワークスペースを使用して作業を整理する方法について説明します。

使い始める準備はできていますか。 ワークスペースを作成します

ワークスペース内で実行されるタスク

機械学習チームにとって、ワークスペースは作業を整理する場所です。 ワークスペースから開始できるタスクの一部を次に示します。

  • ジョブ作成 - ジョブは、モデルの構築に使用するトレーニング実行です。 ジョブを実験としてグループ化し、メトリックを比較できます。
  • オーサーパイプライン - パイプラインは、お使いのモデルをトレーニングおよび再トレーニングするための再利用可能なワークフローです。
  • データ資産の登録 - データ資産は、モデルのトレーニングとパイプラインの作成に使用するデータの管理に役立ちます。
  • モデルの登録 - デプロイするモデルを作成したら、登録済みモデルを作成します。
  • モデルのデプロイ - 登録したモデルとスコアリング スクリプトを使用して、モデルをデプロイします。

ワークスペースでは、機械学習の結果をグループ化するだけでなく、次のリソース構成もホストします。

ワークスペースの整理

機械学習チームのリーダーおよび管理者にとって、ワークスペースはアクセス管理、コスト管理、データ分離のためのコンテナーとして機能します。 ワークスペースを整理するためのヒントを次に示します。

  • [ユーザーの役割] を使用して、ユーザー間のワークスペースでアクセス許可を管理します。 たとえば、データ サイエンティスト、機械学習エンジニア、管理者などです。
  • ユーザー グループにアクセスを割り当てる: Microsoft Entra ユーザー グループを使用すると、各ワークスペースに個別のユーザーを追加したり、同じユーザー グループがアクセスを必要とする他のリソースに追加したりする必要はありません。
  • プロジェクトごとにワークスペースを作成する: ワークスペースは複数のプロジェクトに使用できますが、ワークスペースごとに 1 つのプロジェクトに制限すると、プロジェクト レベルに計上されるコスト レポートが可能になります。 また、各プロジェクトのスコープ内のデータストアなどの構成を管理することもできます。
  • Azure リソースを共有する: ワークスペースでは、関連付けられている複数のリソースを作成する必要があります。 ワークスペース間でこれらのリソースを共有して、繰り返しのセットアップ手順を省略します。
  • セルフサービスを有効にする: 関連するリソース を IT 管理者として事前に作成してセキュリティで保護し、ユーザー ロールを使用してデータ サイエンティストが独自にワークスペースを作成できるようにします。
  • 資産を共有する: Azure Machine Learning レジストリを使用して、ワークスペース間で資産を共有できます。

コンテンツがワークスペースに格納される仕組み

ワークスペースには、スクリプトのログ、メトリクス、出力、系列メタデータ、およびスナップショットを含む、すべてのトレーニング実行の履歴が保持されます。 Azure Machine Learning でタスクを実行すると、成果物が生成されます。 メタデータとデータは、ワークスペースとそれに関連付けられているリソースに格納されます。

関連付けられているリソース

新しいワークスペースを作成するときは、他の Azure リソースを使用してデータを格納する必要があります。 提供されていない場合は、Azure Machine Learning によってこれらのリソースが自動的に作成されます。

  • Azure Storage アカウント。 ジョブ ログなどの機械学習の成果物を格納します。 既定では、ワークスペースにデータをアップロードするときに、このストレージ アカウントが使用されます。 Azure Machine Learning コンピューティングインスタンスで使用される Jupyter ノートブックもここに保存されます。

    重要

    次の場合、既存の Azure Storage アカウントを使用できません

    • BlobStorage 型のアカウント
    • Premium アカウント (Premium_LRS と Premium_GRS)
    • 階層型名前空間 (Azure Data Lake Storage Gen2 で使用) を持つアカウント。

    データストアを作成することで、Premium Storage または階層型名前空間を追加のストレージとして使用できます。

    汎用 v2 にアップグレードした後は、ストレージ アカウントで階層型名前空間を有効にしないでください。

    既存の汎用 v1 ストレージ アカウントを持ち込む場合は、ワークスペースの作成後 に汎用 v2 にアップグレード できます。

  • Azure Container Registry (ACR)。 ユーザーが Azure Machine Learning を使ってカスタム環境をビルドすると、作成された Docker コンテナーを格納します。 AutoML モデルとデータ プロファイルをデプロイすると、カスタム環境の作成がトリガーされます。

    カスタム Docker コンテナーを構築する必要がない場合は、依存関係として ACR なしでワークスペースを作成 できます 。 Azure Machine Learning は、外部コンテナー レジストリから読み取ることができます。

    カスタム Docker イメージをビルドすると、ACR が自動的にプロビジョニングされます。 Azure ロールベースのアクセス制御 (Azure RBAC) を使用して、顧客の Docker コンテナーがビルドされないようにします。

    重要

    サブスクリプション設定で、その下のリソースにタグを追加する必要がある場合、Azure Machine Learning によって作成された ACR は失敗します。これは、タグを ACR に設定できないためです。

  • Azure Application Insights。 推論エンドポイントから診断情報を監視および収集するのに役立ちます。

    詳しくは、「オンライン エンドポイントを監視する」をご覧ください。

  • Azure Key Vault。 コンピューティング先で使用されるシークレット、およびワークスペースで必要な他の機密情報を格納します。

ワークスペースの作成

ワークスペースは、さまざまな方法で作成できます。 開始するには、次のいずれかのオプションを使用します。

  • Azure Machine Learning スタジオを使用すると、既定の設定でワークスペースをすばやく作成できます。
  • その他のセキュリティ オプションを含むポイント アンド クリック インターフェイスには、Azure portal を使用します。
  • Visual Studio Code で作業する場合は、VS Code 拡張機能を使用します。

優先されるセキュリティ設定を使用してワークスペースの作成を自動化するには:

  • Azure Resource Manager/Bicep テンプレートには、Azure リソースをデプロイするための宣言構文が用意されています。 代わりに、Terraform を使用することもできます。 Bicep テンプレートまたは Terraform テンプレートも参照してください。.

  • プロトタイプ作成や MLOps ワークフローの一部として、Azure Machine Learning CLI v1 または Azure Machine Learning SDK v1 for Python を使用します。

    重要

    この記事では、Azure Machine Learning SDK v1 の使用に関する情報を提供します。 SDK v1 は 2025 年 3 月 31 日の時点で非推奨となり、サポートは 2026 年 6 月 30 日に終了します。 SDK v1 は、その日付までインストールして使用できます。

    2026 年 6 月 30 日より前に SDK v2 に移行することをお勧めします。 SDK v2 の詳細については、「 Azure Machine Learning Python SDK v2SDK v2 リファレンスとは」を参照してください。

    重要

    この記事の Azure CLI コマンドの一部では、Azure Machine Learning 用に azure-cli-ml、つまり v1 の拡張機能を使用しています。 v1 拡張機能のサポートは、2025 年 9 月 30 日に終了します。 その日付まで、v1 拡張機能をインストールして使用できます。

    2025 年 9 月 30 日より前に、ml (v2) 拡張機能に移行することをお勧めします。 v2 拡張機能の詳細については、Azure Machine Learning CLI 拡張機能と Python SDK v2 に関する記事を参照してください。

  • REST API は、スクリプト環境、プラットフォーム統合、または MLOps ワークフローで直接使用します。

ワークスペースの操作と管理のためのツール

ワークスペースを設定したら、次の方法で操作できます。

  • Web 上:
  • Azure Machine Learning SDK v1 を使用する任意の Python 環境

    重要

    この記事では、Azure Machine Learning SDK v1 の使用に関する情報を提供します。 SDK v1 は 2025 年 3 月 31 日の時点で非推奨となり、サポートは 2026 年 6 月 30 日に終了します。 SDK v1 は、その日付までインストールして使用できます。

    2026 年 6 月 30 日より前に SDK v2 に移行することをお勧めします。 SDK v2 の詳細については、「 Azure Machine Learning Python SDK v2SDK v2 リファレンスとは」を参照してください。

  • コマンド ラインで、Azure Machine Learning CLI 拡張機能 v1 を使用する

    重要

    この記事の Azure CLI コマンドの一部では、Azure Machine Learning 用に azure-cli-ml、つまり v1 の拡張機能を使用しています。 v1 拡張機能のサポートは、2025 年 9 月 30 日に終了します。 その日付まで、v1 拡張機能をインストールして使用できます。

    2025 年 9 月 30 日より前に、ml (v2) 拡張機能に移行することをお勧めします。 v2 拡張機能の詳細については、Azure Machine Learning CLI 拡張機能と Python SDK v2 に関する記事を参照してください。

  • Azure Machine Learning VS Code 拡張機能

各インターフェイスでは、次のワークスペース管理タスクを使用できます。

ワークスペース管理タスク ポータル スタジオ Python SDK Azure CLI(Azure コマンドライン インターフェイス) VS Code
ワークスペースの作成
ワークスペース アクセスの管理
コンピューティング リソースを作成して管理する
コンピューティング インスタンスを作成する

警告

Azure Machine Learning ワークスペースを別のサブスクリプションに移動したり、所有しているサブスクリプションを新しいテナントに移動したりすることはサポートされていません。 これを行うと、エラーが発生する可能性があります。

サブ リソース

Azure Machine Learning でコンピューティング クラスターとコンピューティング インスタンスを作成すると、サブ リソースが作成されます。

  • VM: ジョブの実行に使用するコンピューティング インスタンスとコンピューティング クラスターにコンピューティング能力を提供します。
  • ロード バランサー: コンピューティング インスタンスおよびクラスターが停止している場合でもトラフィックを管理するために、コンピューティング インスタンスとコンピューティング クラスターごとにネットワーク ロード バランサーが作成されます。
  • 仮想ネットワーク: これらは、Azure リソースが互いに通信したり、インターネットやその他のオンプレミス ネットワークと通信したりするために役立ちます。
  • 帯域幅: リージョン間のすべてのアウトバウンド データ転送をカプセル化します。

次のステップ

組織の要件に合わせてワークスペースを計画する方法の詳細については、Azure Machine Learning の整理とセットアップに関するページを参照してください。

Azure Machine Learning の利用を開始するには、以下を参照してください。