Freigeben über


Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.

Tabellenüberschriften

Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API – Metrischer Name, wie in der REST-API bezeichnet.
Einheit – Maßeinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert, Minimum, Maximum, Gesamt, Anzahl.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Zeitkörnungen - Das Intervall, in dem die Metrik gesampelt wird. PT1M bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M alle 30 Minuten, PT1H jede Stunde usw.
DS Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor Logs exportiert werden kann.

Informationen zum Exportieren von Metriken finden Sie unter " Metrikexport mithilfe von Datensammlungsregeln und Erstellen von Diagnoseeinstellungen in Azure Monitor.

Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.

Kategorie: Ressource

Metrik Name in der REST-API Einheit Aggregierung Dimensionen Zeitkörner DS-Export
Prozentuale CPU-Speicherauslastung

Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuMemoryUtilizationPercentage Prozent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Prozentsatz der CPU-Auslastung

Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuUtilizationPercentage Prozent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Datensammlungsfehler pro Minute

Die Anzahl der Datensammlungsereignisse pro Minute ist gesunken.
DataCollectionErrorsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, reasontype PT1M Nein
Datensammlungsereignisse pro Minute

Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute.
DataCollectionEventsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, type PT1M Nein
Bereitstellungskapazität

Die Anzahl der Instanzen in der Bereitstellung.
DeploymentCapacity Anzahl Minimum, Maximum, Mittelwert instanceId, State PT1M Nein
Datenträgerauslastung

Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
DiskUtilization Prozent Minimum, Maximum, Mittelwert instanceId, disk PT1M Ja
GPU-Energie in Joule

Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet.
GpuEnergyJoules Anzahl Minimum, Maximum, Mittelwert instanceId PT1M Nein
Prozentuale GPU-Speicherauslastung

Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuMemoryUtilizationPercentage Prozent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Prozentuale GPU-Auslastung

Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuUtilizationPercentage Prozent Minimum, Maximum, Mittelwert instanceId PT1M Ja

Kategorie: Verkehr

Metrik Name in der REST-API Einheit Aggregierung Dimensionen Zeitkörner DS-Export
Anforderungswartezeit P50

Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P50 Millisekunden Durchschnitt <keine> PT1M Ja
Anforderungswartezeit P90

Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P90 Millisekunden Durchschnitt <keine> PT1M Ja
Anforderungswartezeit P95

Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P95 Millisekunden Durchschnitt <keine> PT1M Ja
Anforderungswartezeit P99

Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P99 Millisekunden Durchschnitt <keine> PT1M Ja
Anforderungen pro Minute

Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden
RequestsPerMinute Anzahl Durchschnitt envoy_response_code PT1M Nein

Nächste Schritte