ベアメタルマシンプラットフォームコマンド

2025-06-12

この記事では、ベアメタルマシン (BMM) でライフサイクル管理操作を実行する方法について説明します。これらの手順は、障害から復旧するためのトラブルシューティングや、メンテナンスアクションの実行時に使用する必要があります。

まず、操作を続行する前に、ベアメタルマシン操作のベストプラクティスに関する記事のアドバイスを参照してください。

一覧に示されている太字のアクションは、中断と見なされます (電源オフ、再起動、再イメージ化、置換)。 evacuate パラメーターを指定しない Cordon アクションは中断と見なされませんが、evacuate パラメーターを持つ Cordon は中断を伴うと見なされます。

ベアメタルマシンの電源をオフにする
ベアメタルマシンを起動する
ベアメタルマシンを再起動する
ベアメタルマシンをスケジュール設定できないようにする (退避なしの切断、ノードをドレインしない)
ベアメタルマシンをスケジュール設定できないようにする (退避して切断し、ノードをドレインする)
ベアメタルマシンをスケジュール設定できるようにする (切断しない)
ベアメタルマシンを再イメージ化する
ベアメタルマシンを置き換える

注意事項

Microsoft サポート担当者と最初に相談しないと、制御プレーンサーバーまたは管理プレーンサーバーに対して何もアクションを実行しないでください。そうすると、オペレーターネクサスクラスターの整合性に影響する可能性があります。

重要

Kubernetes コントロールプレーン (KCP) ノードに対する複数の破壊的コマンド要求が拒否されます。このチェックは、Nexus クラスターインスタンスの整合性を維持し、同時に中断するアクションが原因で複数の KCP ノードが一度に非動作にならないようにするために行われます。拒否された破壊的アクションコマンドは、別の KCP ノードに対して既に実行されているか、完全な KCP が使用できないことが原因である可能性があります。複数のノードが動作しなくなると、Kubernetesコントロールプレーンの正常なクォーラムしきい値が損なわれます。

一覧に示されているアクションは、BareMetal Machines (BMM) に対して破壊的影響を及ぼすと見なされます。

BMM の電源をオフにする
BMM を再起動する
BMM をスケジュール不可にする (退避して切断し、ノードをドレインする)
BMM を再イメージ化する
BMM を置き換える

中断しないアクションのみを残します。

BMM を起動する
BMM をスケジュール設定できないようにする (退避せずに切断し、ノードをドレインしない)
BMM をスケジュール設定できるようにする (切断しない)

前提条件

適切な CLI 拡張機能の最新バージョンをインストールします。
Azure Operator Nexus ネットワークファブリック (NF) とネットワーククラウド CLI 拡張機能コマンドを実行するためのアクセスを要求します。
Azure CLI にサインインし、クラスターがデプロイされているサブスクリプションを選択します。
次の情報を収集します。
- サブスクリプション ID (SUBSCRIPTION)
- クラスター名 (CLUSTER)
- リソースグループ (CLUSTER_RG)
- マネージドリソースグループ (CLUSTER_MRG) - BareMetal Machines (BMM) リソースがマネージドリソースグループに存在する
- ライフサイクル管理操作を必要とする BareMetal マシン名 (BMM_NAME)

ベアメタルマシンの電源をオフにする

重要

まれに、実行中の Nexus VM が BMM シャットダウンまたは再起動後に再起動に失敗する場合があります。このような場合を防ぐには、BMM の電源をオフにするか再起動する前に、BMM 上の仮想マシンの電源をオフにします。 BMM で実行されているワークロードを見つける手順については、 cordon コマンドを参照してください。

このコマンドは、指定された power-off を bareMetalMachineName します。

az networkcloud baremetalmachine power-off \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンを起動する

このコマンドは、指定された start を bareMetalMachineName します。

az networkcloud baremetalmachine start \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンを再起動する

重要

このコマンドは、指定された restart を bareMetalMachineName します。

az networkcloud baremetalmachine restart \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンをスケジュール設定できないようにする (切断する)

cordon コマンドを実行すると、ベアメタルマシンをスケジュール不可能にすることができます。 cordon コマンドを実行すると、cordonが設定されている場合、オペレーターネクサスワークロードはベアメタルマシンでスケジュールされません。 cordonedベアメタルマシンでワークロードを作成しようとすると、ワークロードがpending状態に設定されます。ワークロードがドレインされない限り、既存のワークロードはベアメタルマシンで引き続き実行されます。

ベアメタルマシンのワークロードをドレインする

cordon コマンドは、evacuate パラメーターをサポートしています。このパラメーターの既定値 False により、cordon コマンドが新しいワークロードのスケジュールを妨げます。 cordon コマンドを使用してワークロードをドレインするには、evacuate パラメーターを True に設定する必要があります。ベアメタルマシンで実行されているワークロードは stopped され、ベアメタルマシンは pending 状態に設定されます。

注

Nexus Management ワークロードは、サーバーが切断されて避難している場合でも、ベアメタルマシン上で引き続き実行されます。

ベアメタルサーバーでメンテナンス操作を実行する場合は、 evacuate の値を True に設定することをお勧めします。その他のベストプラクティスについては、ベアメタルマシン操作のベストプラクティスに関する記事を参照してください。

az networkcloud baremetalmachine cordon \
  --evacuate "True" \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンでワークロードが現在実行されているかどうかを確認するには、次のコマンドを実行します。

Virtual Machines の場合:

az networkcloud baremetalmachine show -n <nodeName> /
  --resource-group <resourceGroup> /
  --subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'

Nexus Kubernetes クラスターノードの場合: (Nexus Kubernetes クラスターへのログインが必要)

kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'

ベアメタルマシンをスケジュール設定できるようにする (切断しない)

uncordon コマンドを実行して、ベアメタルマシンを "スケジュール可能" にすることができます (サーバーはワークロードをホストできます)。ベアメタルマシンが pending されると、ベアメタルマシンの restarted 状態のすべてのワークロードが uncordoned されます。

az networkcloud baremetalmachine uncordon \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンを再イメージ化する

ベアメタルマシンでランタイムバージョンを復元する場合は、 reimage コマンドを実行します。 reimageアクションは、ベアメタルマシン上のテナントワークロードファイルには影響しません。このプロセスでは、ターゲットのベアメタルマシンにランタイムイメージを 再デプロイ し、同じ識別子を持つクラスターに再び参加する手順を実行します。

ベストプラクティスとして、cordon コマンドを実行する前に、evacuateを True に設定して、reimage コマンドを使用してベアメタルマシンのワークロードがドレインされていることを確認します。その他のベストプラクティスについては、ベアメタルマシン操作のベストプラクティスに関する記事を参照してください。

重要

ベアメタルマシンアクセスを介してノードで実行される書き込みまたは編集操作は避けてください。 reimageアクションは、Microsoft サポートを復元するために必要であり、ベアメタルマシンに対して行われた変更は、ノードを予期された状態に復元中に失われます。

警告

同じ BareMetal Machine (BMM) リソースに対して複数の baremetalmachine replace または reimage コマンドを同時に実行しないでください。 replaceと同時にreimageを実行すると、サーバーは非動作状態になります。別の BMM を開始する前に、BMM の replace/reimage が完全に完了していることを確認します。また、指定されたメンテナンス操作が実行されていない限り、reimageアクションを完了したばかりの BMM に対して、順次replaceアクションを実行しないようにします。

az networkcloud baremetalmachine reimage \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

ベアメタルマシンを置き換える

完全または部分的なハードウェア交換が必要なハードウェアの問題がサーバーで発生した場合は、replace コマンドを使用します。マザーボードやネットワークインターフェイスカード (NIC) などのコンポーネントを交換した後、ベアメタルマシンの MAC アドレスが変更されます。ただし、iDRAC の IP アドレスとホスト名は変わりません。各ハードウェアメンテナンス操作の後には必ずreplace実行する必要があります。詳細についてはベアメタルマシンの置き換えのベストプラクティスをお読みください。

2506.2 リリースの時点で、iDRAC のパスワード値は、Key Vault Uniform Resource Identifier (URI) またはパスワード値として指定できます。 Key Vault 資格情報リファレンスを参照してください。プレーンテキストパスワードの代わりに URI を使用すると、セキュリティが強化されます。

警告

az networkcloud baremetalmachine replace \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --bmc-credentials password=<PASSWORD_URI or IDRAC_PASSWORD> username=<IDRAC_USER> \
  --bmc-mac-address <IDRAC_MAC> \
  --boot-mac-address <PXE_MAC> \
  --machine-name <OS_HOSTNAME> \
  --serial-number <SERIAL_NUMBER> \
  --subscription <subscriptionID>

ハードウェア検証エラーが原因で replace アクションが失敗した場合、次の例に示すように、 replace 応答に特定のエラーまたはテストエラーが表示されます。この情報は、ベアメタルマシン (オペレーターネクサス) のアクティビティログでも確認できます。エラーコードとエラーメッセージには、対応する BareMetalMachines_Replace 操作の JSON プロパティが含まれています。

例 1: Baseboard Management Controller (BMC) 資格情報の Key Vault URI が無効なため、ハードウェア検証が失敗する

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=$KEY_VAULT_URI username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(failed to retrieve password from key vault) failed to get secret value from key vault: failed to get cluster key vault secret
Code: failed to retrieve password from key vault
Message: failed to retrieve password from key vault
Response: 400 Bad Request

例 2: Baseboard Management Controller (BMC) 資格情報が無効なため、ハードウェアの検証が失敗する

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Code: None
Message: BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]

例 3: ネットワーク障害が原因でハードウェア検証が失敗する

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Code: None
Message: Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]

ハードウェア検証エラーのトラブルシューティングの詳細については、「ハードウェア検証エラーのトラブルシューティング」を参照してください。

次の方法で共有

ベアメタルマシンプラットフォームコマンド

前提条件

ベア メタル マシンの電源をオフにする

ベア メタル マシンを起動する

ベア メタル マシンを再起動する

ベア メタル マシンをスケジュール設定できないようにする (切断する)

ベア メタル マシンのワークロードをドレインする

ベア メタル マシンでワークロードが現在実行されているかどうかを確認するには、次のコマンドを実行します。

ベア メタル マシンをスケジュール設定できるようにする (切断しない)

ベア メタル マシンを再イメージ化する

ベア メタル マシンを置き換える

フィードバック

その他のリソース