リアルタイム推論のために新しいデプロイの安全なロールアウトを実行する

2025-05-08

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

この記事では、中断を引き起こさずに、新しいバージョンの機械学習モデルを運用環境にデプロイする方法について説明します。安全なロールアウト戦略とも呼ばれるブルーグリーンデプロイ戦略を使用して、新しいバージョンの Web サービスを運用環境に導入します。この戦略を使用する場合は、完全にロールアウトする前に、新しいバージョンの Web サービスを少数のユーザーまたは要求にロールアウトできます。

この記事では、オンラインエンドポイントまたはオンライン (リアルタイム) 推論に使用されるエンドポイントを使用することを前提としています。オンラインエンドポイントには、2 つの種類があります。マネージドオンラインエンドポイントと Kubernetes オンラインエンドポイントです。エンドポイントとエンドポイントの種類の違いの詳細については、「マネージドオンラインエンドポイントと Kubernetes オンラインエンドポイント」を参照してください。

この記事では、デプロイにマネージドオンラインエンドポイントを使用します。ただし、マネージドオンラインエンドポイントの代わりに Kubernetes エンドポイントを使用する方法を説明するメモも含まれています。

この記事では、次の方法について説明します。

モデルの最初のバージョンを提供するために、 blue というデプロイを使用してオンラインエンドポイントを定義します。
blueデプロイをスケーリングして、より多くの要求を処理できるようにします。
green デプロイと呼ばれる 2 番目のバージョンのモデルをエンドポイントにデプロイしますが、ライブトラフィックは送信しません。
greenデプロイを分離してテストします。
ライブトラフィックの割合を green デプロイにミラーリングして検証します。
ライブトラフィックのごく一部を green デプロイに送信します。
すべてのライブトラフィックを green デプロイに送信します。
未使用の blue 展開を削除します。

前提条件

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

Azure CLI と Azure CLI のml拡張機能(インストールおよび構成済み)。詳細については、「 CLI のインストールと設定 (v2)」を参照してください。
Bash シェルまたは互換性のあるシェル (Linux システム上のシェルや Linux 用 Windows サブシステムなど)。この記事の Azure CLI の例では、この種類のシェルを使用することを前提としています。
Azure Machine Learning ワークスペース。ワークスペースを作成する手順については、「設定」を参照してください。

次の Azure ロールベースのアクセス制御 (Azure RBAC) ロールの少なくとも 1 つを持つユーザーアカウント。
- Azure Machine Learning ワークスペースの所有者ロール
- Azure Machine Learning ワークスペースの共同作成者ロール
- Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*アクセス許可を持つカスタムロール
詳細については、「Azure Machine Learning ワークスペースへのアクセスの管理」を参照してください。
必要に応じて、 Docker エンジンがインストールされ、ローカルで実行されます。この前提条件を強くお勧めします。モデルをローカルにデプロイするために必要であり、デバッグに役立ちます。

適用対象: Python SDK azure-ai-ml v2 (現行)

Azure Machine Learning ワークスペース。ワークスペースを作成する手順については、「ワークスペースの作成」を参照してください。
Azure Machine Learning SDK for Python v2。 SDK をインストールするには、次のコマンドを使用します。
```
pip install azure-ai-ml azure-identity
```
SDK の既存のインストールを最新バージョンに更新するには、次のコマンドを使用します。
```
pip install --upgrade azure-ai-ml azure-identity
```
詳細については、「 Python 用 Azure Machine Learning パッケージクライアントライブラリ」を参照してください。

次の Azure ロールベースのアクセス制御 (Azure RBAC) ロールの少なくとも 1 つを持つユーザーアカウント。
- Azure Machine Learning ワークスペースの所有者ロール
- Azure Machine Learning ワークスペースの共同作成者ロール
- Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*アクセス許可を持つカスタムロール
詳細については、「Azure Machine Learning ワークスペースへのアクセスの管理」を参照してください。
必要に応じて、 Docker エンジンがインストールされ、ローカルで実行されます。この前提条件を強くお勧めします。モデルをローカルにデプロイするために必要であり、デバッグに役立ちます。

Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。
Azure Machine Learning ワークスペース。ワークスペースを作成する手順については、「ワークスペースの作成」を参照してください。
次の Azure ロールベースのアクセス制御 (Azure RBAC) ロールの少なくとも 1 つを持つユーザーアカウント。
- Azure Machine Learning ワークスペースの所有者ロール
- Azure Machine Learning ワークスペースの共同作成者ロール
- Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*アクセス許可を持つカスタムロール
詳細については、「Azure Machine Learning ワークスペースへのアクセスの管理」を参照してください。

システムを準備する

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

環境変数の設定

Azure CLI で使用する既定値を構成できます。サブスクリプション、ワークスペース、およびリソースグループの値が複数回渡されないようにするには、次のコードを実行します。

az account set --subscription <subscription-ID>
az configure --defaults workspace=<Azure-Machine-Learning-workspace-name> group=<resource-group-name>

examples リポジトリをクローンします

このアーティクルに従って、まずサンプルリポジトリ (azureml-examples) を複製します。次に、リポジトリの cli/ ディレクトリに移動します。

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

ヒント

--depth 1を使用してリポジトリに最新のコミットのみを複製します。これにより、操作を完了するために必要な時間が短縮されます。

このチュートリアルのコマンドは cli ディレクトリの deploy-safe-rollout-online-endpoints.sh ファイルにあり、YAML 構成ファイルは endpoints/online/managed/sample/ サブディレクトリにあります。

注意

Kubernetes オンラインエンドポイントの YAML 構成ファイルは、endpoints/online/kubernetes/ サブディレクトリにあります。

examples リポジトリをクローンします

トレーニング例を実行するには、最初に例のリポジトリ (azureml-examples) を複製します。次に、azureml-examples/sdk/python/endpoints/online/managed directory に移動します。

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

ヒント

--depth 1を使用してリポジトリに最新のコミットのみを複製します。これにより、操作を完了するために必要な時間が短縮されます。

このアーティクルの情報は、online-endpoints-safe-rollout.ipynb ノートブックに基づいています。この記事にはノートブックと同じコンテンツが含まれていますが、コードブロックの順序は 2 つのドキュメント間で若干異なります。

注意

Kubernetes オンラインエンドポイントのステップは、kubernetes-online-endpoints-safe-rollout.ipynb ノートブックに基づいています。

Azure Machine Learning ワークスペースへの接続

ワークスペースは、Azure Machine Learning の最上位のリソースです。ワークスペースでは、Azure Machine Learning を使用するときに作成するすべての成果物を一元的に操作できます。このセクションでは、デプロイタスクを実行するワークスペースに接続します。作業を進めるには、online-endpoints-safe-rollout.ipynb ノートブックを開きます。

必要なライブラリをインポートします。
```
# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential
```
注意

Kubernetes オンラインエンドポイントを使用している場合は、azure.ai.ml.entities ライブラリから KubernetesOnlineEndpoint クラスと KubernetesOnlineDeployment クラスをインポートします。
ワークスペース設定を構成し、ワークスペースへのハンドルを取得します。

ワークスペースに接続するには、識別子パラメーター (サブスクリプション、リソースグループ、ワークスペース名) が必要です。この情報は、azure.ai.ml モジュールの MLClient クラスで使用して、必要な Azure Machine Learning ワークスペースへのハンドルを取得します。次の例では、既定の Azure 認証を使用しています。
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

ローカルコンピューターに Git をインストール済みの場合は、手順に従ってサンプルリポジトリを複製できます。それ以外の場合は、手順に従ってサンプルリポジトリからファイルをダウンロードします。

examples リポジトリをクローンします

この記事に従うには、 azureml-examples リポジトリを複製してから、azureml-examples/cli/endpoints/online/model-1 フォルダーに移動します。

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

ヒント

--depth 1を使用してリポジトリに最新のコミットのみを複製します。これにより、操作を完了するために必要な時間が短縮されます。

サンプルリポジトリからファイルをダウンロードする

サンプルリポジトリを複製する代わりに、リポジトリをローカルコンピューターにダウンロードできます。

https://github.com/Azure/azureml-examples/ にアクセスします。
[コード<>選択し、[ローカル] タブに移動し、[ZIP のダウンロード] を選択します。

エンドポイントとデプロイを定義する

オンラインエンドポイントは、オンライン (リアルタイム) の推論に使用されます。オンラインエンドポイントには、クライアントからデータを受信して、リアルタイムで応答を返信できる準備が整ったデプロイが含まれています。

エンドポイントを定義する

次の表は、エンドポイントを定義する際に指定する主な属性を一覧表示しています。

属性	必須または省略可能	内容
名前	必須	エンドポイントの名前。 Azure リージョンで一意である必要があります。名前付け規則の詳細については、 Azure Machine Learning オンラインエンドポイントとバッチエンドポイントに関するページを参照してください。
認証モード	オプション	エンドポイントの認証方法。キーベースの認証、 `key`、Azure Machine Learning トークンベースの認証、 `aml_token`から選択できます。キーには有効期限がありませんが、トークンには有効期限があります。認証の詳細については、「オンラインエンドポイントのクライアントを認証する」を参照してください。
内容	オプション	エンドポイントの説明。
タグ	オプション	エンドポイントのタグのディクショナリ。
トラフィック	オプション	デプロイ間でトラフィックをルーティングする方法に関するルール。トラフィックはキーと値のペアのディクショナリとして表します。ここで、キーはデプロイ名を表し、値はそのデプロイへのトラフィックの割合を表します。トラフィックは、エンドポイントの下のデプロイが作成された後にのみ設定できます。デプロイの作成後に、オンラインエンドポイントのトラフィックを更新することもできます。ミラー化されたトラフィックの使用方法の詳細については、「新しいデプロイへのライブトラフィックのごく一部の割り当て」を参照してください。
トラフィックのミラーリング	オプション	デプロイにミラーリングするライブトラフィックの割合。ミラー化されたトラフィックを使用する方法の詳細については、「ミラー化されたトラフィックを使用してデプロイをテストする」を参照してください。

エンドポイントの作成時に指定できる属性の完全な一覧については、 CLI (v2) オンラインエンドポイント YAML スキーマを参照してください。 Python 用 Azure Machine Learning SDK のバージョン 2 については、「 ManagedOnlineEndpoint クラス」を参照してください。

デプロイを定義する

デプロイは、実際の推論を行うモデルをホストするために必要なリソースのセットです。次の表は、デプロイを定義する際に指定する主な属性について説明しています。

属性	必須または省略可能	内容
名前	必須	デプロイメントの名前。
エンドポイント名	必須	デプロイを作成するエンドポイントの名前。
モデル	オプション	デプロイに使用するモデル。この値は、ワークスペース内の既存のバージョン管理されたモデルへの参照またはインラインモデルの仕様のいずれかです。この記事の例では、 `scikit-learn` モデルは回帰を行います。
コードパス	オプション	モデルをスコア付けするためのすべての Python ソースコードを含むローカル開発環境上のフォルダーへのパス。入れ子になったディレクトリとパッケージを使用できます。
スコアリングスクリプト	オプション	指定された入力要求に対してモデルを実行する Python コード。この値には、ソースコードフォルダー内のスコアリングファイルへの相対パスを指定できます。スコアリングスクリプトは、デプロイされた Web サービスに送信されたデータを受け取り、それをモデルに渡します。その後、スクリプトはモデルを実行して、その応答をクライアントに返します。スコアリングスクリプトはモデルに固有のものであり、モデルが入力として期待し、出力として返すデータを理解する必要があります。この記事の例では、score.py ファイルを使用します。この Python コードには、`init` 関数と `run` 関数が含まれている必要があります。 `init`関数は、モデルの作成または更新後に呼び出されます。たとえば、モデルをメモリにキャッシュするために使用できます。 `run` 関数は、実際のスコアリングおよび予測を実行するために、エンドポイントが呼び出されるたびに呼び出されます。
環境	必須	モデルとコードをホスティングする環境。この値は、ワークスペース内の既存のバージョン管理された環境への参照、またはインライン環境仕様のいずれかになります。この環境には、Conda の依存関係を持つ Docker イメージ、Dockerfile、または登録済みの環境を使用できます。
インスタンスの種類	必須	デプロイに使用する仮想マシンのサイズ。サポートされているサイズの一覧については、マネージドオンラインエンドポイント SKU の一覧を参照してください。
インスタンス数	必須	デプロイに使用するインスタンスの数。期待するワークロードに基づいて値を設定します。高可用性を実現するために、少なくとも 3 つのインスタンスを使用することをお勧めします。 Azure Machine Learning では、アップグレードを実行するために追加の 20% が予約されます。詳細については、 Azure Machine Learning オンラインエンドポイントとバッチエンドポイントに関するページを参照してください。

デプロイの作成時に指定できる属性の完全な一覧については、 CLI (v2) マネージドオンラインデプロイ YAML スキーマに関する説明を参照してください。 Python SDK のバージョン 2 については、 ManagedOnlineDeployment クラスを参照してください。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

オンラインエンドポイントの作成

最初にエンドポイント名を設定してから構成します。この記事では、endpoints/online/managed/sample/endpoint.yml ファイルを使用してエンドポイントを構成します。このファイルには、次の行が含まれています。

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

次の表では、エンドポイント YAML 形式で使用されるキーについて説明します。これらの属性を指定する方法については、 CLI (v2) オンラインエンドポイント YAML スキーマを参照してください。マネージドオンラインエンドポイントに関連する制限については、 Azure Machine Learning オンラインエンドポイントとバッチエンドポイントに関するページを参照してください。

鍵	内容
`$schema`	(省略可能) YAML スキーマ。 YAML ファイルで使用可能なすべてのオプションを表示するには、前のコードブロックのスキーマをブラウザーで表示します。
`name`	エンドポイントの名前。
`auth_mode`	認証モード。キーベースの認証に `key` を使用します。 Azure Machine Learning のトークンベースの認証に `aml_token` を使用します。最新のトークンを取得するには、`az ml online-endpoint get-credentials` コマンドを使用します。

オンラインエンドポイントを作成するには。

次の Unix コマンドを実行して、エンドポイント名を設定します。 YOUR_ENDPOINT_NAME を一意の名前に置き換えます。
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
重要

エンドポイント名は Azure リージョン内で一意である必要があります。たとえば、Azure westus2 リージョンでは、my-endpoint という名前のエンドポイントは 1 つしか使用できません。
次のコードを実行して、クラウドにエンドポイントを作成します。このコードでは、endpoint.yml ファイルを使用してエンドポイントを構成します。
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

青いデプロイを作成する

エンドポイント/オンライン/マネージド/サンプル/blue-deployment.yml ファイルを使用して、 blueという名前のデプロイの主要な側面を構成できます。このファイルには、次の行が含まれています。

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

blue-deployment.yml ファイルを使用してエンドポイントの blue デプロイを作成するには、次のコマンドを実行します。

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

重要

az ml online-deployment create コマンドの--all-traffic フラグは、エンドポイントトラフィックの 100% を新しく作成されたblueデプロイに割り当てます。

blue-deployment.yaml ファイルの path 行は、ファイルのアップロード先を指定します。 Azure Machine Learning CLI では、この情報を使用してファイルをアップロードし、モデルと環境を登録します。運用環境のベストプラクティスとして、モデルと環境を登録し、YAML コードで登録済みの名前とバージョンを個別に指定する必要があります。 model: azureml:my-model:1など、モデルの形式model: azureml:<model-name>:<model-version>を使用します。環境では、environment: azureml:my-env:1などの形式environment: azureml:<environment-name>:<environment-version>を使用します。

登録するためには、model と environment の YAML 定義を別々の YAML ファイルに抽出し、az ml model create コマンドと az ml environment create コマンドを使用します。これらのコマンドの詳細については、 az ml model create -h と az ml environment create -hを実行します。

モデルを資産として登録する方法の詳細については、「 Azure CLI または Python SDK を使用してモデルを登録する」を参照してください。環境の作成の詳細については、「カスタム環境の作成」を参照してください。

オンラインエンドポイントの作成

マネージドオンラインエンドポイントを作成するには、ManagedOnlineEndpointクラスを使用します。このクラスは、エンドポイントの主要な側面を構成する方法を提供します。

エンドポイントを構成します。

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

注意

Kubernetes オンラインエンドポイントを作成するには、 KubernetesOnlineEndpointクラスを使用します。

エンドポイントを作成します。

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

青いデプロイを作成する

マネージドオンラインエンドポイントのデプロイを作成するには、ManagedOnlineDeployment クラスを使用します。このクラスは、デプロイの重要な側面を構成する方法を提供します。

blue展開を構成します。
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
この例では、 path パラメーターで、ファイルのアップロード先を指定します。 Python SDK では、この情報を使用してファイルをアップロードし、モデルと環境を登録します。運用環境のベストプラクティスとして、モデルと環境を登録し、登録された名前とバージョンをコードで個別に指定する必要があります。

モデルを資産として登録する方法の詳細については、「 Azure CLI または Python SDK を使用してモデルを登録する」を参照してください。

環境の作成の詳細については、「カスタム環境の作成」を参照してください。

注意

Kubernetes オンラインエンドポイントのデプロイを作成するには、KubernetesOnlineDeploymentクラスを使用します。

デプロイを作成します。

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Azure Machine Learning Studio でマネージドオンラインエンドポイントを作成する場合は、エンドポイントの初期デプロイを定義する必要があります。デプロイを定義する前に、ワークスペースにモデルが登録されている必要があります。次のセクションでは、デプロイに使用するモデルを登録する方法を示します。

モデルを登録する

モデルの登録は、ワークスペース内の論理エンティティです。このエンティティには、単一のモデルファイル、または複数ファイルのディレクトリを含めることができます。運用環境のベストプラクティスとして、モデルと環境を登録する必要があります。

モデル例を登録するには、次のセクションの手順を実行します。

モデルファイルをアップロードする

[Azure Machine Learning Studio] に移動します。
[ モデル] を選択します。
[ 登録] を選択し、[ ローカルファイルから] を選択します。
[ モデルの種類] で、[ 未指定の型] を選択します。
[ 参照] を選択し、[ フォルダーの参照] を選択します。
先ほど複製またはダウンロードしたリポジトリのローカルコピーに移動し、 \azureml-examples\cli\endpoints\online\model-1\model を選択します。メッセージが表示されたら、[ アップロード ] を選択し、アップロードが完了するまで待ちます。
[次へ] を選択します。

モデルの構成と登録

[ モデルの設定 ] ページの [ 名前] に、モデルのフレンドリ名を入力します。この記事の手順では、モデルの名前が model-1 であることを前提としています。
[ 次へ] を選択し、[ 登録 ] を選択して登録を完了します。

この記事の後の例では、リポジトリのローカルコピーの \azureml-examples\cli\endpoints\online\model-2\model フォルダーからモデルを登録する必要もあります。そのモデルを登録するには、前の 2 つのセクションの手順を繰り返しますが、モデルに model-2名前を付けます。

登録済みモデルの操作の詳細については、「 Azure Machine Learning で登録済みモデルを操作する」を参照してください。

スタジオで環境を作成する方法については、「環境の作成」を参照してください。

マネージドオンラインエンドポイントと青いデプロイを作成する

Azure Machine Learning Studio を使用して、ブラウザーで直接マネージドオンラインエンドポイントを作成できます。スタジオでマネージドオンラインエンドポイントを作成する場合は、初期デプロイを定義する必要があります。空のマネージドオンラインエンドポイントを作成することはできません。

スタジオでマネージドオンラインエンドポイントを作成する方法の 1 つは、[モデル] ページからの作成です。この方法は、既存のマネージドオンラインデプロイにモデルを追加するための簡単な方法でもあります。前に「モデルの登録」セクションで登録した model-1 という名前のモデルをデプロイするには、次のセクションの手順を実行します。

モデルの選択

Azure Machine Learning Studio に移動し、[モデル] を選択します。
一覧で、 model-1 モデルを選択します。
[デプロイ]>[リアルタイムエンドポイント] を選択します。

エンドポイントに関する詳細情報を指定するために使用できるウィンドウが開きます。

初期設定を構成する

[ エンドポイント名] に、エンドポイントの名前を入力します。
[ コンピューティングの種類] で、[ マネージド] の既定値をそのまま使用します。
[ 認証の種類] で、 キーベースの認証の既定値をそのまま使用します。
[ 次へ] を選択し、[ モデル ] ページで [ 次へ] を選択します。

残りの設定を構成し、デプロイを作成する

[ デプロイ ] ページで、次の手順を実行します。
1. [ デプロイ名] に 「青」と入力します。
2. 後でスタジオでエンドポイントアクティビティのグラフを表示する場合:
  1. [ 推論データの収集] で、トグルをオンにします。
  2. Application Insights の診断で、トグルをオンにします。
3. [次へ] を選択します。
[ 推論のコードと環境] ページで 、次の手順を実行します。
1. [ 推論用のスコアリングスクリプトの選択] で [ 参照] を選択し、先ほど複製またはダウンロードしたリポジトリから \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py ファイルを選択します。
2. 環境の一覧の上にある検索ボックスで 、sklearn の入力を開始し、 sklearn-1.5:19 キュレーションされた環境を選択します。
3. [次へ] を選択します。
[ コンピューティング ] ページで、次の手順を実行します。
1. [ 仮想マシン] で、既定値をそのまま使用します。
2. [ インスタンス数] で、既定値を 1 に置き換えます。
3. [次へ] を選択します。
[ ライブトラフィック ] ページで、[ 次へ ] を選択して、既定のトラフィック割り当ての 100% を blue デプロイに受け入れます。
[ 確認 ] ページで、展開設定を確認し、[ 作成] を選択します。

[エンドポイント] ページからエンドポイントを作成する

あるいは、スタジオの [エンドポイント] ページでマネージドオンラインエンドポイントを作成することもできます。

[Azure Machine Learning Studio] に移動します。
[エンドポイント] を選択します。
を選択してを作成します。

ウィンドウが開き、エンドポイントとデプロイに関する詳細情報を指定できます。
モデルを選んで、選択をクリックします。
前の 2 つのセクションで説明したように、エンドポイントとデプロイの設定を入力します。各手順で既定値を使用し、最後の手順で [ 作成 ] を選択してデプロイを作成します。

既存のデプロイを確認する

既存のデプロイを確認する方法の 1 つは、特定の入力要求に対してモデルをスコア付けできるようにエンドポイントを呼び出すことです。 Azure CLI または Python SDK を使用してエンドポイントを呼び出す場合は、受信トラフィックを受信するデプロイの名前を指定できます。

注意

Azure CLI または Python SDK とは異なり、Azure Machine Learning Studio では、エンドポイントを呼び出すときにデプロイを指定する必要があります。

デプロイ名を使用してエンドポイントを呼び出す

エンドポイントを呼び出すときに、トラフィックを受信するデプロイの名前を指定できます。この場合、Azure Machine Learning はエンドポイントトラフィックを指定されたデプロイに直接ルーティングし、その出力を返します。 Azure Machine Learning CLI v2 の--deployment-name オプション、または Python SDK v2 の deployment_name オプションを使用してデプロイを指定できます。

デプロイを指定せずにエンドポイントを呼び出す

トラフィックを受信するデプロイを指定せずにエンドポイントを呼び出すと、Azure Machine Learning は、トラフィック制御設定に基づいてエンドポイントの受信トラフィックをエンドポイントのデプロイにルーティングします。

トラフィック制御設定では、受信トラフィックの指定された割合がエンドポイント内の各デプロイに割り当てられます。たとえば、トラフィックルールでエンドポイント内の特定のデプロイが受信トラフィックを 40% 受信するように指定している場合、Azure Machine Learning はエンドポイントトラフィックの 40% をそのデプロイにルーティングします。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

既存のエンドポイントとデプロイの状態を表示するには、次のコマンドを実行します。

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

出力には、 $ENDPOINT_NAME エンドポイントと blue デプロイに関する情報が一覧表示されます。

サンプルデータを使用してエンドポイントをテストする

エンドポイントは、 invoke コマンドを使用して呼び出すことができます。次のコマンドでは、 sample-request.json JSON ファイルを使用してサンプル要求を送信します。

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

次のコードを使用して、モデルデプロイの状態を確認します。

ml_client.online_endpoints.get(name=online_endpoint_name)

サンプルデータを使用してエンドポイントをテストする

前に作成した MLClient のインスタンスを使用して、エンドポイントへのハンドルを取得できます。エンドポイントを呼び出すには、次のパラメーターを指定して invoke コマンドを使用できます。

endpoint_name: エンドポイントの名前
request_file: 要求データを含むファイル
deployment_name: エンドポイントでテストするデプロイの名前

次のコードでは、 sample-request.json JSON ファイルを使用してサンプル要求を送信します。

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

マネージドオンラインエンドポイントを表示する

スタジオエンドポイントページでは、すべてのマネージドオンラインエンドポイントを表示できます。各エンドポイントのページの [詳細 ] タブには、エンドポイント URI、状態、テストツール、アクティビティモニター、デプロイログ、サンプル消費コードなどの重要な情報が表示されます。この情報を表示するには、次の手順を実行します。

スタジオで、[エンドポイント] を選択 します。ワークスペース内のすべてのエンドポイントの一覧が表示されます。
必要に応じて、マネージド型のみを表示するフィルターをコンピューティングインスタンスの種類に作成します。
エンドポイント名を選択して、エンドポイントの [詳細] ページを表示します。

サンプルデータを使用してエンドポイントをテストする

エンドポイントページで、[ テスト ] タブを使用して、マネージドオンラインデプロイをテストできます。サンプル入力を入力して結果を表示するには、次の手順を実行します。

エンドポイントページで、[ テスト ] タブに移動します。[ 展開 ] の一覧で、 blue 展開が既に選択されています。
sample-request.json ファイルに移動し、そのサンプル入力をコピーします。
スタジオで、サンプル入力を [入力 ] ボックスに貼り付けます。
[Test] を選択します。

より多くのトラフィックを処理できるように既存のデプロイをスケーリングする

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

オンラインエンドポイントを使用した機械学習モデルのデプロイとスコア付けで説明されているデプロイでは、デプロイ YAML ファイルで instance_count の値を 1 に設定します。 update コマンドを使用してスケールアウトできます。

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

注意

前のコマンドでは、 --set オプションによってデプロイ構成がオーバーライドされます。または、--file オプションを使用して、YAML ファイルを更新し、update コマンドに入力として渡すことができます。

前に作成した MLClient のインスタンスを使用して、デプロイへのハンドルを取得できます。デプロイをスケーリングするには、 instance_countの値を増減できます。

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

エンドポイントに関する詳細情報を取得する

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

インスタンスの数を調整してデプロイをスケールアップまたはスケールダウンするには、次の手順を実行します。

エンドポイントページで、[ 詳細 ] タブに移動し、 blue 展開のカードを見つけます。
blue展開カードのヘッダーで、編集アイコンを選択します。
[ インスタンス数] に「 2」と入力します。
[更新] を選択します。

新しいモデルをデプロイするが、トラフィックを送信しない

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

green という名前の新しいデプロイを作成します。

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

greenデプロイにトラフィックを明示的に割り当てていないため、そこにはトラフィックがゼロに割り当てられています。次のコマンドを使用して、その事実を確認できます。

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

新しいデプロイをテストする

greenデプロイには 0% のトラフィックが割り当てられていますが、--deployment オプションを使用して直接呼び出すことができます。

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

トラフィックルールを介さずに、REST クライアントを使用して直接デプロイを呼び出したい場合、azureml-model-deployment: <deployment-name> という HTTP ヘッダーを設定します。次のコードでは、URL 用クライアント (cURL) を使用してデプロイを直接呼び出します。 Unix または Windows Subsystem for Linux (WSL) 環境でコードを実行できます。 $ENDPOINT_KEY値を取得する手順については、「データプレーン操作のキーまたはトークンを取得する」を参照してください。

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

マネージドオンラインエンドポイントの新しいデプロイを作成し、デプロイに greenという名前を付けます。

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

注意

Kubernetes オンラインエンドポイントのデプロイを作成する場合は、 KubernetesOnlineDeployment クラスを使用し、 Kubernetes クラスターで Kubernetes インスタンスの種類を指定します。

新しいデプロイをテストする

greenデプロイには割り当てられたトラフィックの 0% が割り当てられていますが、エンドポイントとデプロイを引き続き呼び出すことができます。次のコードでは、 sample-request.json JSON ファイルを使用してサンプル要求を送信します。

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

新しいデプロイを作成して、マネージドオンラインエンドポイントに追加できます。 greenという名前のデプロイを作成するには、次のセクションの手順を実行します。

初期設定を構成する

エンドポイントページで、[ 詳細 ] タブに移動し、[ デプロイの追加] を選択します。
[ モデルの選択 ] ページで、 モデル 2 を選択し、[選択] を選択します。
[ エンドポイント ] ページと [ モデル ] ページで、[ 次へ] を選択します。
[ デプロイ ] ページで、次の手順を実行します。
1. [ デプロイ名] に「緑」と入力します。
2. [ 推論データの収集] で、トグルをオンにします。
3. Application Insights の診断で、トグルをオンにします。
4. [次へ] を選択します。
[ 推論のコードと環境] ページで 、次の手順を実行します。
1. [ 推論のスコアリングスクリプトの選択] で [ 参照] を選択し、先ほど複製またはダウンロードしたリポジトリから \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py ファイルを選択します。
2. 環境の一覧の上にある検索ボックスで 、sklearn の入力を開始し、 sklearn-1.5:19 キュレーションされた環境を選択します。
3. [次へ] を選択します。
[ コンピューティング ] ページで、次の手順を実行します。
1. [ 仮想マシン] で、既定値をそのまま使用します。
2. [ インスタンス数] で、既定値を 1 に置き換えます。
3. [次へ] を選択します。

残りの設定を構成し、デプロイを作成する

[ ライブトラフィック ] ページで、[ 次へ ] を選択して、既定のトラフィック割り当てとして、 blue デプロイに 100%、 greenに 0% を受け入れます。
[ 確認 ] ページで、展開設定を確認し、[ 作成] を選択します。

[モデル] ページからデプロイを追加する

または、 [モデル] ページを使用してデプロイを追加することもできます。

スタジオで、[ モデル] を選択します。
一覧からモデルを選択します。
[デプロイ]>[リアルタイムエンドポイント] を選択します。
[ エンドポイント] で [ 既存] を選択します。
エンドポイントの一覧で、モデルをデプロイするマネージドオンラインエンドポイントを選択し、[ 次へ] を選択します。
[ モデル ] ページで、[ 次へ] を選択します。
green展開の作成を完了するには、「初期設定の構成」セクションの手順 4 から 6、および「残りの設定を構成してデプロイ」セクションのすべての手順に従います。

注意

エンドポイントに新しいデプロイを追加する場合は、[ トラフィック割り当ての更新 ] ページを使用して、デプロイ間のトラフィックバランスを調整できます。ただし、この記事の残りの手順に従うには、現時点では、既定のトラフィック割り当てを blue デプロイに 100%、 green デプロイに対して 0% のままにします。

新しいデプロイをテストする

トラフィックの 0% が green デプロイに送信される場合でも、エンドポイントとそのデプロイを呼び出すことができます。エンドポイントページで、[ テスト ] タブを使用して、マネージドオンラインデプロイをテストできます。サンプル入力を入力して結果を表示するには、次の手順を実行します。

エンドポイントページで、[ テスト ] タブに移動します。
デプロイ リストで、グリーンを選択します。
sample-request.json ファイルに移動し、そのサンプル入力をコピーします。
スタジオで、サンプル入力を [入力 ] ボックスに貼り付けます。
[Test] を選択します。

ミラーリングされたトラフィックを使ってデプロイをテストする

greenデプロイをテストした後、その割合のトラフィックをコピーして、greenデプロイに送信することで、エンドポイントへのライブトラフィックの割合をミラーリングできます。トラフィックミラーリング ( シャドウとも呼ばれます) は、クライアントに返される結果を変更しません。要求の 100% は引き続き blue デプロイに送信されます。トラフィックのミラー化された割合がコピーされ、 green デプロイにも送信されるため、クライアントに影響を与えずにメトリックとログを収集できます。

ミラーリングは、クライアントに影響を与えずに新しいデプロイを検証する場合に便利です。たとえば、ミラーリングを使用して、待機時間が許容範囲内にあるかどうかを確認したり、HTTP エラーがないことを確認したりできます。新しいデプロイをテストするためのトラフィックミラーリング (シャドウ) の使用は、シャドウテストとも呼ばれます。ミラー化されたトラフィックを受信するデプロイ (この場合は green デプロイ) は、 シャドウデプロイと呼ばれることもできます。

ミラーリングには次の制限事項があります。

ミラーリングは、バージョン 2.4.0 以降の Azure Machine Learning CLI とバージョン 1.0.0 以降の Python SDK でサポートされています。古いバージョンの Azure Machine Learning CLI または Python SDK を使用してエンドポイントを更新すると、ミラートラフィック設定が失われます。
現在、ミラーリングは、Kubernetes オンラインエンドポイントではサポートされていません。
トラフィックは、エンドポイント内の 1 つのデプロイにのみミラーリングできます。
ミラー化できるトラフィックの最大割合は 50% です。この上限により、エンドポイント帯域幅クォータへの影響が制限されます。既定値は 5 MBps です。割り当てられたクォータを超えると、エンドポイントの帯域幅が調整されます。帯域幅調整の監視については、「帯域幅の調整」を参照してください。

また、次の動作にも注意してください。

両方ではなく、ライブトラフィックまたはミラー化されたトラフィックのみを受信するようにデプロイを構成できます。
エンドポイントを呼び出すときに、そのデプロイの名前 (シャドウデプロイでも) を指定して、予測を返すことができます。
エンドポイントを呼び出し、受信トラフィックを受信するデプロイの名前を指定すると、Azure Machine Learning はトラフィックをシャドウデプロイにミラーリングしません。デプロイを指定しない場合、Azure Machine Learning は、エンドポイントに送信されたトラフィックからシャドウデプロイにトラフィックをミラーリングします。

ミラー化されたトラフィックの 10% を受信するように green デプロイを設定した場合、クライアントは引き続き blue 展開からのみ予測を受け取ります。

エンドポイントを通過するトラフィックフローを示す図。すべてのトラフィックが青色のデプロイに送信され、10% が緑色のデプロイにミラーリングされます。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

次のコマンドを使用して、トラフィックの 10% をミラーリングし、 green デプロイに送信します。

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

受信トラフィックを受信するデプロイを指定せずにエンドポイントを複数回呼び出すことで、ミラー化されたトラフィックをテストできます。

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

指定した割合のトラフィックが green デプロイに送信されることを確認するには、デプロイのログを確認します。

az ml online-deployment get-logs --name green --endpoint $ENDPOINT_NAME

テスト後、ミラートラフィックを 0 に設定して、ミラーリングを無効にすることができます。

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

トラフィックの 10% をミラー化し、 green デプロイに送信するには、次のコードを使用します。

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

受信トラフィックを受信するデプロイを指定せずにエンドポイントを複数回呼び出すことで、ミラー化されたトラフィックをテストできます。

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

指定した割合のトラフィックが green デプロイに送信されることを確認するには、デプロイのログを確認します。

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

テスト後、ミラートラフィックを 0 に設定して、ミラーリングを無効にすることができます。

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

トラフィックの 10% をミラーリングし、 green デプロイに送信するには、次の手順を実行します。

エンドポイントページで、[ 詳細 ] タブに移動し、[ トラフィックの更新] を選択します。
ミラー化されたトラフィックを有効にする トグルをオンにします。
[ デプロイ名 ] の一覧 で、緑色を選択します。
[ トラフィック割り当て %] で、既定値の 10% のままにします。
[更新] を選択します。

エンドポイントの詳細ページに、 green デプロイに対する 10% のミラー化されたトラフィック割り当てが表示されるようになりました。

ミラーリングされたトラフィックをテストするには、Azure CLI または Python のタブを参照してエンドポイントを複数回呼び出します。デプロイからのログを確認して、指定した割合のトラフィックが green デプロイに送信されることを確認します。 [ログ] タブに移動して、エンドポイントページのデプロイログにアクセスできます。

メトリックとログを使用して、ミラー化されたトラフィックのパフォーマンスを監視することもできます。詳しくは、「オンラインエンドポイントを監視する」をご覧ください。

テスト後、次の手順を実行してミラーリングを無効にすることができます。

エンドポイントページで、[ 詳細 ] タブに移動し、[ トラフィックの更新] を選択します。
ミラー化されたトラフィックを有効にするトグルをオフにします。
[更新] を選択します。

ライブトラフィックの小さい割合を新しいデプロイに割り当てる

greenデプロイをテストした後、それに対するトラフィックのごく一部を割り当てます。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

ヒント

トラフィックの合計割合は、トラフィックを無効にするには 0% に、トラフィックを有効にするには 100% にする必要があります。

green デプロイは、すべてのライブトラフィックの 10% を受け取るようになりました。クライアントは、 blue と green の両方のデプロイから予測を受け取ります。

エンドポイントを通過するトラフィックフローを示す図。青色のデプロイはトラフィックの 90% を受け取り、緑のデプロイは 10% を受け取ります。

すべてのトラフィックを新しいデプロイに送信する

greenデプロイに完全に満足したら、すべてのトラフィックをそれに切り替えます。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

以前のデプロイを削除する

次の手順に従って、マネージドオンラインエンドポイントから個々のデプロイを削除します。個々のデプロイを削除しても、マネージドオンラインエンドポイント内の他のデプロイには影響しません。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

注意

ライブトラフィックが割り当てられているデプロイは削除できません。デプロイを削除する前に、デプロイのトラフィック割り当てを 0% に設定する必要があります。

エンドポイントページで、[ 詳細 ] タブに移動し、 blue 展開カードに移動します。
デプロイ名の横にある削除アイコンを選択します。

エンドポイントとデプロイを削除する

エンドポイントとデプロイを使用する予定がない場合は、削除してください。エンドポイントを削除すると、その基になるデプロイもすべて削除されます。

Azure CLI
Python SDK
[スタジオ](#tab/azure-studio)

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

次の方法で共有

リアルタイム推論のために新しいデプロイの安全なロールアウトを実行する

前提条件

システムを準備する

環境変数の設定

examples リポジトリをクローンします

エンドポイントとデプロイを定義する

エンドポイントを定義する

デプロイを定義する

オンライン エンドポイントの作成

青いデプロイを作成する

既存のデプロイを確認する

デプロイ名を使用してエンドポイントを呼び出す

デプロイを指定せずにエンドポイントを呼び出す

サンプル データを使用してエンドポイントをテストする

より多くのトラフィックを処理できるように既存のデプロイをスケーリングする

新しいモデルをデプロイするが、トラフィックを送信しない

新しいデプロイをテストする

ミラーリングされたトラフィックを使ってデプロイをテストする

ライブ トラフィックの小さい割合を新しいデプロイに割り当てる

すべてのトラフィックを新しいデプロイに送信する

以前のデプロイを削除する

エンドポイントとデプロイを削除する

関連するコンテンツ

フィードバック

その他のリソース

オンラインエンドポイントの作成

サンプルデータを使用してエンドポイントをテストする

ライブトラフィックの小さい割合を新しいデプロイに割り当てる