Azure Machine Learning によってキュレーションされたオープンソースの基盤モデルを使用する方法

2025-07-28

この記事では、モデルカタログで基礎モデルを微調整、評価、デプロイする方法について説明します。

モデルカードのサンプル推論フォームを使用して、事前トレーニング済みモデルをすばやくテストし、結果をテストするための独自のサンプル入力を提供できます。さらに、各モデルのモデルカードには、モデルの簡単な説明と、モデルのコードベースの推論、微調整、評価のサンプルへのリンクが含まれています。

独自のテストデータを使用して基盤モデルを評価する方法

評価 UI フォームを使用するか、モデルカードからリンクされたコードベースのサンプルを使用して、テストデータセットに対して基礎モデルを評価できます。

スタジオを使用した評価

任意の基盤モデルのモデルカードの [評価] ボタンをクリックして、[モデルの評価] フォームを呼び出すことができます。

ユーザーが基盤モデルのモデルカード上の [評価] ボタンを選んだ後の、評価設定フォームを示すスクリーンショット。

モデルを使用する特定の推論タスクの各モデルを評価できます。

テストデータ:

モデルの評価に使用するテストデータを渡します。ローカルファイル (JSONL 形式) をアップロードするか、ワークスペースから既存の登録済みデータセットを選ぶかを選択できます。
データセットを選択したら、タスクに必要なスキーマに基づいて、入力データの列をマップする必要があります。たとえば、テキスト分類の '文' キーと 'ラベル' キーに対応する列名をマップします

コンピューティング:

モデルの微調整に使用する Azure Machine Learning コンピューティングクラスターを指定します。評価は GPU コンピューティングで実行する必要があります。使用するコンピューティング SKU に十分なコンピューティングクォータがあることを確認します。
評価フォームで [完了] を選んで、評価ジョブを送信します。ジョブが完了すると、モデルの評価メトリックを表示できます。評価メトリックに基づいて、独自のトレーニングデータを使用してモデルを微調整するかどうかを決定できます。さらに、モデルを登録してエンドポイントにデプロイするかどうかを決定できます。

コードベースのサンプルを使用した評価

モデルの評価を開始できるように、 azureml-examples git リポジトリの評価サンプルにサンプル (Python ノートブックと CLI の例の両方) が用意されています。各モデルカードは、対応するタスクの評価サンプルにもリンクされています

独自のトレーニングデータを使用して基盤モデルを微調整する方法

ワークロードでモデルのパフォーマンスを向上させるために、独自のトレーニングデータを使用して基盤モデルを微調整する必要がある場合があります。これらの基盤モデルを簡単に微調整するには、スタジオの微調整設定を使用するか、モデルカードからリンクされたコードベースのサンプルを使用します。

スタジオを使用して微調整する

任意の基盤モデルのモデルカードの [微調整] ボタンを選択して、微調整設定フォームを呼び出すことができます。

微調整設定:

基盤モデルの微調整設定フォームの微調整設定オプションを示すスクリーンショット。

タスクの種類の微調整

モデルカタログのすべての事前トレーニング済みモデルは、特定のタスクセット (テキスト分類、トークン分類、質問応答など) に対して微調整できます。ドロップダウンから使用するタスクを選びます。

トレーニングデータ

モデルの微調整に使用するトレーニングデータを渡します。ローカルファイル (JSONL、CSV または TSV 形式) をアップロードするか、ワークスペースから既存の登録済みデータセットを選ぶかを選択できます。
データセットを選択したら、タスクに必要なスキーマに基づいて、入力データの列をマップする必要があります。たとえば、テキスト分類の '文' キーと 'ラベル' キーに対応する列名をマップします

検証データ: モデルの検証に使用するデータを渡します。 [自動分割] を選ぶと、トレーニングデータの自動分割が検証用に予約されます。または、別の検証データセットを指定することもできます。
テストデータ: 微調整したモデルの評価に使用するテストデータを渡します。 [自動分割] を選ぶと、トレーニングデータの自動分割がテスト用に予約されます。
コンピューティング: モデルの微調整に使用する Azure Machine Learning コンピューティングクラスターを指定します。微調整は GPU コンピューティングで実行する必要があります。微調整を行うときは、A100/V100 GPU でコンピューティング SKU を使用することをお勧めします。使用するコンピューティング SKU に十分なコンピューティングクォータがあることを確認します。

微調整フォームで [完了] を選択して、微調整ジョブを送信します。ジョブが完了すると、微調整したモデルの評価メトリックを表示できます。その後、微調整ジョブによって微調整されたモデル出力を登録し、推論のためにこのモデルをエンドポイントにデプロイできます。

コードベースのサンプルを使用した微調整

現在、Azure Machine Learning では、次の言語タスクのモデルの微調整がサポートされています。

テキスト分類
トークンの分類
質問応答
要約
翻訳

ユーザーが微調整をすぐに開始できるように、 azureml-examples git リポジトリの各タスクのサンプル (Python ノートブックと CLI の例の両方) を公開しました。各モデルカードは、サポートされている微調整タスクの微調整サンプルにもリンクされています。

推論のためにエンドポイントに基盤モデルをデプロイする

基盤モデルを、推論に使用できるエンドポイントにデプロイできます。これらの基盤モデルには、モデルカタログから事前トレーニングされたモデルと、ワークスペースに登録された微調整されたモデルの両方が含まれます。標準デプロイとマネージドコンピューティングの両方へのデプロイがサポートされています。これらのモデルをデプロイするには、UI の展開ウィザードを使用するか、モデルカードからリンクされたコードベースのサンプルを使用します。

スタジオを使用したデプロイ

モデルをデプロイするには、任意の基礎モデルのモデルカードで [ このモデルを使用 する] ボタンを選択し、 サーバーレス API または マネージドコンピューティングを選択します。すべてのモデルがサーバーレス API デプロイをサポートしているわけではありません。モデルがサーバーレス API をサポートしていない場合は、[ マネージドコンピューティング ] オプションのみが表示されます。

[配置の設定]

サーバーレス API を選択すると、展開フォームが表示されます。展開フォームでは、展開名、および展開に使用するコンテンツフィルター処理とモデルバージョンを有効にするかどうかを指定できます。モデルをテストするためのサンプル入力データを提供することもできます。

[マネージドコンピューティング] を選択すると、展開設定フォームが表示されます。デプロイ設定フォームでは、使用する仮想マシン SKU、インスタンスの数、デプロイに使用するエンドポイント名を指定できます。

ユーザーが [デプロイ] ボタンを選んだ後の、基盤モデルカードのデプロイオプションを示すスクリーンショット。

共有クォータ

モデルカタログからモデルをデプロイしているが、デプロイに使用できるクォータが不足している場合、Azure Machine Learning では、共有クォータプールからのクォータを限られた時間使用できます。共有クォータについて詳しくは、「Azure Machine Learning の共有クォータ」をご覧ください。

コードベースのサンプルを使用したデプロイ

デプロイと推論をすぐに開始できるように、 azureml-examples Git リポジトリの推論サンプルにサンプルが用意されています。公開されているサンプルには、Python ノートブックと CLI の例が含まれます。各モデルカードは、リアルタイムおよびバッチ推論の推論サンプルにもリンクされています。

基盤モデルのインポート

モデルカタログを検索しても、必要なオープンソースモデルが見つからない場合は、Hugging Face から Azure Machine Learning ワークスペースにインポートできます。 [ インポート] ボタンは、検索で結果が返されない場合にのみ、モデルカタログに表示されます。

Hugging Face は、一般的な NLP タスク用に事前トレーニング済みのモデルを提供する自然言語処理 (NLP) 用のオープンソースライブラリです。現時点では、モデルインポートノートブックに記載されている要件をモデルが満たしている限り、モデルインポートでは次のタスクのモデルのインポートがサポートされています。

fill-mask
トークン分類
質問応答
要約
テキスト生成
テキスト分類
移動
画像分類
テキストから画像生成

Note

Hugging Face のモデルには、Hugging Face モデルの詳細ページで入手可能なサードパーティライセンス条項が適用されます。モデルのライセンス条項を遵守するのは、お客様の責任です。

検索で結果が返されない場合は、[ モデルノートブックのインポート ] を選択してモデルインポートノートブックを使用します。

検索で基礎モデルカタログに結果が返されない場合に表示されるモデルのインポートボタンを示すスクリーンショット。

モデルインポートノートブックは、こちらの azureml-examples の Git リポジトリにも含まれています。

モデルをインポートするには、Hugging Face からインポートするモデルの MODEL_ID を渡す必要があります。 Hugging Face ハブでモデルを参照し、インポートするモデルを特定します。モデルのタスクの種類が、サポートされているタスクの種類の 1 つであることを確認します。モデル ID をコピーします。これはページの URI で使用できます。または、モデル名の横にあるコピーアイコンを使用してコピーできます。モデルインポートノートブックの変数 'MODEL_ID' に割り当てます。次に例を示します。

Hugging Face モデルのドキュメントページに表示されているとおりに、Hugging Face のモデル ID ('bert-base-uncased') の例を示すスクリーンショット。

モデルのインポートを実行するには、コンピューティングを提供する必要があります。モデルインポートを実行すると、指定したモデルが Hugging Face からインポートされ、Azure Machine Learning ワークスペースに登録されます。その後、このモデルを微調整するか、推論のためにエンドポイントにデプロイできます。

詳細情報

Azure Machine Learning スタジオでモデルカタログを調べます。カタログを調べるには、Azure Machine Learning ワークスペースが必要です。
モデルカタログとコレクションについて確認する

次の方法で共有

Azure Machine Learning によってキュレーションされたオープンソースの基盤モデルを使用する方法

独自のテスト データを使用して基盤モデルを評価する方法

スタジオを使用した評価

コード ベースのサンプルを使用した評価

独自のトレーニング データを使用して基盤モデルを微調整する方法