다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
테이블 제목
메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 그레인 - 메트릭이 샘플링되는 간격을 나타냅니다. 예를 들어, PT1M
은 메트릭이 1분마다, PT30M
은 30분마다, PT1H
는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.
메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조 하세요.
범주: 에이전트
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
에이전트 이 작업 영역의 AI 에이전트에 대한 이벤트 수 |
Agents |
개수 | 평균, 최대, 최소, 합계(Sum) | EventType |
PT1M | 아니오 |
인덱싱된파일 이 작업 영역에서 파일 검색을 위해 인덱싱된 파일 수 |
IndexedFiles |
개수 | 평균, 최대, 최소, 합계(Sum) |
ErrorCode
Status
VectorStoreId
|
PT1M | 아니오 |
메시지 이 작업 영역의 AI 에이전트 메시지에 대한 이벤트 수 |
Messages |
개수 | 평균, 최대, 최소, 합계(Sum) |
EventType , ThreadId |
PT1M | 아니오 |
실행 이 작업 영역에서 AI 에이전트의 실행 수 |
Runs |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId , RunStatus , StatusCode StreamType |
PT1M | 아니오 |
Threads 이 작업 영역의 AI 에이전트 스레드에 대한 이벤트 수 |
Threads |
개수 | 평균, 최대, 최소, 합계(Sum) | EventType |
PT1M | 아니오 |
토큰 이 작업 영역의 AI 에이전트별 토큰 수 |
Tokens |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId , TokenType |
PT1M | 아니오 |
ToolCalls 이 작업 영역에서 AI 에이전트가 수행한 도구 호출 |
ToolCalls |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId , ToolName |
PT1M | 아니오 |
범주: 모델
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
모델 배포 실패 이 작업 영역에서 실패한 모델 배포 수 |
Model Deploy Failed |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , StatusCode |
PT1M | 예 |
모델 배포 시작 이 작업 영역에서 시작한 모델 배포 수 |
Model Deploy Started |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 배포 성공 이 작업 영역에서 성공한 모델 배포 수 |
Model Deploy Succeeded |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 등록 실패 이 작업 영역에서 실패한 모델 등록 수 |
Model Register Failed |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , StatusCode |
PT1M | 예 |
모델 등록 성공 이 작업 영역에서 성공한 모델 등록 수 |
Model Register Succeeded |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
범주: 할당량
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
Active Cores 활성 코어 수 |
Active Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
활성 노드 Active 노드의 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다. |
Active Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
유휴 코어 유휴 코어 수 |
Idle Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
유휴 노드 유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다. |
Idle Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
나가는 코어 떠나는 코어 수 |
Leaving Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
노드를 종료합니다. 나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다. |
Leaving Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
선점된 코어 선점된 코어 수 |
Preempted Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
선점된 노드 선점된 노드 수. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다. |
Preempted Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
할당량 사용률 사용된 할당량의 백분율 |
Quota Utilization Percentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName , VmFamilyName VmPriority |
PT1M | 예 |
총 코어 수 총 코어 수 |
Total Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
총 노드 수 총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다. |
Total Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
사용할 수 없는 코어 사용할 수 없는 코어 수 |
Unusable Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
사용할 수 없는 노드 사용할 수 없는 노드 수입니다. 해결할 수 없는 문제 때문에 사용할 수 없는 노드는 작동하지 않습니다. Azure에서는 이러한 노드를 재활용합니다. |
Unusable Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , ClusterName |
PT1M | 예 |
범주: 리소스
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
CPU 용량 밀리코어 CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다. |
CpuCapacityMillicores |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
CpuMemoryCapacityMegabytes CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
CpuMemoryUtilizationMegabytes CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
CpuMemoryUtilizationPercentage CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
CPU 사용률 CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , runId , NodeId ClusterName |
PT1M | 예 |
CPU 사용밀리코어 CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationMillicores |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
CpuUtilizationPercentage CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
DiskAvailMegabytes 사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskAvailMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
DiskReadMegabytes 디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskReadMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
DiskUsedMegabytes 사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskUsedMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
DiskWriteMegabytes 디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskWriteMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
GpuCapacityMilliGPUs GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다. |
GpuCapacityMilliGPUs |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuEnergyJoules GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , runId , rootRunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryCapacityMegabytes GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다. |
GpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryUtilization GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
GpuMemoryUtilizationMegabytes GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryUtilizationPercentage GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuUtilization GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
GpuUtilizationMilliGPUs GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationMilliGPUs |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuUtilizationPercentage GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
IB 수신 메가바이트 InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBReceiveMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
IBTransmitMegabytes InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBTransmitMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
NetworkInputMegabytes 수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다. |
NetworkInputMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
네트워크 출력 메가바이트 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkOutputMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
저장소 API 오류 횟수 Azure Blob Storage API 호출 실패 횟수 |
StorageAPIFailureCount |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
저장소API성공횟수 Azure Blob Storage API 호출 성공 횟수 |
StorageAPISuccessCount |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
범주: 달리기
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
요청된 실행 취소 이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다. |
Cancel Requested Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
취소된 실행 이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다. |
Cancelled Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
완료된 실행 이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다. |
Completed Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
오류 이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다. |
Errors |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
실패한 실행 이 작업 공간에서 실패한 실행 횟수입니다. 실행이 실패하면 수가 업데이트 됩니다. |
Failed Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 완료 이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다. |
Finalizing Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
응답하지 않는 실행 이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다. |
Not Responding Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
시작되지 않은 실행 이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다. |
Not Started Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
준비 중인 실행 이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다. |
Preparing Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
프로비저닝 중인 실행 이 작업 영역을 위해 프로비저닝되는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다. |
Provisioning Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
큐에서 대기 중인 실행 이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 개수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다. |
Queued Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
시작된 실행 이 작업 영역에 대해 실행 중인 실행 수. 필요한 리소스에서 실행이 시작되면 개수가 업데이트됩니다. |
Started Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 시작 이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 정보를 포함한 실행 생성 요청이 처리된 후, 정보가 채워지고 나면 개수가 업데이트됩니다. |
Starting Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
경고 이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다. |
Warnings |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |