Important
この機能は パブリック プレビュー段階です。
システム テーブルで MLflow メタデータを使用すると、ダッシュボードを作成して MLflow 実験を分析し、ワークスペース全体から実行できます。 これらのタスクに既存の MLflow UI と REST API を使用するには、時間のかかる広範なイテレーションが必要になります。
1 回の実行の詳細のダッシュボード
MLflow データの視覚化を開始するには、 このサンプル ダッシュボード を JSON ファイルとしてダウンロードし、 ワークスペースにインポートします。 このダッシュボードには、MLflow UI の実行の詳細ページに表示される内容をレプリケートするためのデータのスケルトンが含まれています。
特定の実験 ID、実行 ID、メトリック名について、実行の詳細と共に、タグ、パラメーター、メトリック グラフが表示されます。 実験 ID と実行 ID は、UI と URL 自体の両方から実行の詳細ページ ( https://<workspace>.databricks.com/ml/experiments/<experiment_id>/runs/<run_id>) から取得できます。
左側のナビゲーション メニューからダッシュボード パネルに移動する場合は、 ここで JSON ファイル定義からダッシュボードをインポートできます。 そこから、上部の入力ボックスを使用して、プロットするワークスペース内の関連する実行と実験をフィルター処理できます。 自由にクエリを調べ、ニーズに合わせてプロットを変更してください。
実験全体の平均 GPU 使用率を監視するダッシュボード
上記のダッシュボードの 4 番目のタブでは、メトリック名を入力して、特定の時間枠内でそのメトリックを使用するすべての実験の概要統計を取得できます。 この情報は、非効率的な CPU、メモリ、または GPU 使用率を監視するために、ワークスペース全体で MLflow によって記録された システム メトリック を監視するのに役立ちます。
この例では、調査する可能性がある平均 GPU 使用率が 10% 未満の複数の実験を確認できます。