다음을 통해 공유


Microsoft.MachineLearningServices/workspaces에 지원되는 메트릭

다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

테이블 제목

메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 그레인 - 메트릭이 샘플링되는 간격을 나타냅니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.

메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.

메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조 하세요.

범주: 에이전트

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
에이전트

이 작업 영역의 AI 에이전트에 대한 이벤트 수
Agents 개수 평균, 최대, 최소, 합계(Sum) EventType PT1M 아니오
인덱싱된파일

이 작업 영역에서 파일 검색을 위해 인덱싱된 파일 수
IndexedFiles 개수 평균, 최대, 최소, 합계(Sum) ErrorCode Status VectorStoreId PT1M 아니오
메시지

이 작업 영역의 AI 에이전트 메시지에 대한 이벤트 수
Messages 개수 평균, 최대, 최소, 합계(Sum) EventType, ThreadId PT1M 아니오
실행

이 작업 영역에서 AI 에이전트의 실행 수
Runs 개수 평균, 최대, 최소, 합계(Sum) AgentId, RunStatus, StatusCodeStreamType PT1M 아니오
Threads

이 작업 영역의 AI 에이전트 스레드에 대한 이벤트 수
Threads 개수 평균, 최대, 최소, 합계(Sum) EventType PT1M 아니오
토큰

이 작업 영역의 AI 에이전트별 토큰 수
Tokens 개수 평균, 최대, 최소, 합계(Sum) AgentId, TokenType PT1M 아니오
ToolCalls

이 작업 영역에서 AI 에이전트가 수행한 도구 호출
ToolCalls 개수 평균, 최대, 최소, 합계(Sum) AgentId, ToolName PT1M 아니오

범주: 모델

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
모델 배포 실패

이 작업 영역에서 실패한 모델 배포 수
Model Deploy Failed 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 배포 시작

이 작업 영역에서 시작한 모델 배포 수
Model Deploy Started 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 배포 성공

이 작업 영역에서 성공한 모델 배포 수
Model Deploy Succeeded 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 등록 실패

이 작업 영역에서 실패한 모델 등록 수
Model Register Failed 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 등록 성공

이 작업 영역에서 성공한 모델 등록 수
Model Register Succeeded 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M

범주: 할당량

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
Active Cores

활성 코어 수
Active Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
활성 노드

Active 노드의 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다.
Active Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 코어

유휴 코어 수
Idle Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 노드

유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다.
Idle Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
나가는 코어

떠나는 코어 수
Leaving Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
노드를 종료합니다.

나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다.
Leaving Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 코어

선점된 코어 수
Preempted Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 노드

선점된 노드 수. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다.
Preempted Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
할당량 사용률

사용된 할당량의 백분율
Quota Utilization Percentage 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName, VmFamilyNameVmPriority PT1M
총 코어 수

총 코어 수
Total Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
총 노드 수

총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다.
Total Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 코어

사용할 수 없는 코어 수
Unusable Cores 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 노드

사용할 수 없는 노드 수입니다. 해결할 수 없는 문제 때문에 사용할 수 없는 노드는 작동하지 않습니다. Azure에서는 이러한 노드를 재활용합니다.
Unusable Nodes 개수 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M

범주: 리소스

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
CPU 용량 밀리코어

CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다.
CpuCapacityMillicores 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
CpuMemoryCapacityMegabytes

CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryCapacityMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
CpuMemoryUtilizationMegabytes

CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
CpuMemoryUtilizationPercentage

CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationPercentage 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
CPU 사용률

CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
CpuUtilization 개수 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeIdClusterName PT1M
CPU 사용밀리코어

CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationMillicores 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
CpuUtilizationPercentage

CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationPercentage 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
DiskAvailMegabytes

사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskAvailMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
DiskReadMegabytes

디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskReadMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
DiskUsedMegabytes

사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskUsedMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
DiskWriteMegabytes

디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskWriteMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
GpuCapacityMilliGPUs

GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다.
GpuCapacityMilliGPUs 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuEnergyJoules

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules 개수 평균, 최대, 최소, 합계(Sum) Scenario, runId, rootRunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryCapacityMegabytes

GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다.
GpuMemoryCapacityMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilization

GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilization 개수 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuMemoryUtilizationMegabytes

GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilizationPercentage

GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationPercentage 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilization

GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuUtilization 개수 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuUtilizationMilliGPUs

GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationMilliGPUs 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilizationPercentage

GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationPercentage 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
IB 수신 메가바이트

InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBReceiveMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
IBTransmitMegabytes

InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBTransmitMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
NetworkInputMegabytes

수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다.
NetworkInputMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
네트워크 출력 메가바이트

발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
NetworkOutputMegabytes 개수 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
저장소 API 오류 횟수

Azure Blob Storage API 호출 실패 횟수
StorageAPIFailureCount 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M
저장소API성공횟수

Azure Blob Storage API 호출 성공 횟수
StorageAPISuccessCount 개수 평균, 최대, 최소, 합계(Sum) RunId InstanceId ComputeName PT1M

범주: 달리기

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
요청된 실행 취소

이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다.
Cancel Requested Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
취소된 실행

이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다.
Cancelled Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
완료된 실행

이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다.
Completed Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
오류

이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다.
Errors 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
실패한 실행

이 작업 공간에서 실패한 실행 횟수입니다. 실행이 실패하면 수가 업데이트 됩니다.
Failed Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 완료

이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다.
Finalizing Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
응답하지 않는 실행

이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다.
Not Responding Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작되지 않은 실행

이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다.
Not Started Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
준비 중인 실행

이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다.
Preparing Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
프로비저닝 중인 실행

이 작업 영역을 위해 프로비저닝되는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다.
Provisioning Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
큐에서 대기 중인 실행

이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 개수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다.
Queued Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작된 실행

이 작업 영역에 대해 실행 중인 실행 수. 필요한 리소스에서 실행이 시작되면 개수가 업데이트됩니다.
Started Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 시작

이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 정보를 포함한 실행 생성 요청이 처리된 후, 정보가 채워지고 나면 개수가 업데이트됩니다.
Starting Runs 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
경고

이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다.
Warnings 개수 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M

다음 단계