次の方法で共有


Apache Spark の実行系列を監視する

Apache Spark の実行系列では、次のものがそれぞれの実行系列に自動的に分類されます。

  • 定期的なパイプライン アクティビティからの Apache Spark アプリケーション、または手動ノートブックの実行。
  • Apache Spark ジョブは、同じノートブックまたは Apache Spark ジョブ定義からそれぞれの実行系列に実行されます。

実行系列機能は、各 Spark アプリケーション インスタンスの期間の傾向と、Spark アプリケーションの対応するデータの入力と出力の近似曲線を視覚的に表します。 また、実行系列を自動スキャンし、異常な Spark アプリケーションの実行があるかどうかを検出します。 この機能を使用すると、特定の Spark アプリケーションの詳細を表示できます。

実行系列監視機能にアクセスする

監視ハブの履歴ビューから、実行系列監視機能にアクセスできます。

  1. Microsoft Fabric ポータルを開き、[監視ハブ] メニューに移動します。

  2. Spark ジョブ定義またはノートブックを開き、[その他のオプション] ドロップダウン リストを展開し、[実行履歴] を選択します。

  3. 表示するジョブを選択し、[その他のオプション] を展開し、[実行系列の監視] を選択します。

    履歴ビューからの実行系列へのアクセスを示すスクリーンショット。

ノートブックまたは Spark ジョブ定義の [最近の実行] パネルから、実行系列監視機能にアクセスできます。

  1. Microsoft Fabric ホームページを開き、ジョブを表示するワークスペースを選択します。

  2. [Spark ジョブ定義] または [ノートブック項目のコンテキスト] メニューを選択すると、最近の実行オプションが表示されます。

  3. [最近の実行] を選択します。

  4. アプリケーションを選択し、[その他のオプション] ドロップダウン リストを展開し、[実行系列の監視] を選択します。

    最近の実行からのアクセス実行系列へのアクセスを示すスクリーンショット。

Spark アプリケーションの監視の詳細 ページから、実行系列監視機能にアクセスできます。

  1. Apache Spark アプリケーション監視の詳細ページに移動します。

  2. [実行系列の監視] オプションを選択します。

    Spark アプリケーション監視の詳細ページからの実行系列へのアクセスを示すスクリーンショット。

Spark アプリケーションのパフォーマンスを表示する

Spark 実行グラフでは、この実行系列の期間の傾向を表示できます。 各縦棒は、ノートブック/Spark ジョブ定義のアクティビティの実行のインスタンスを表し、高さは実行時間を示します。 各実行中インスタンスをクリックすると、より詳細な情報を表示したり、特定の時間枠を拡大または縮小したりできます。

Spark 実行中のグラフを示すスクリーンショット。

  • Duration
  • 期間(異常)
  • 読み取りバイト
  • 書き込みバイト

色のアイコンを選択すると、すべてのグラフの対応するコンテンツが選択または選択解除されます。

選択または選択解除する色アイコンを示すスクリーンショット。

グラフのノートブック/Spark ジョブ定義のアクティビティの実行のインスタンスを選択すると、インスタンスの期間の分布Executor の実行分布、および Spark の構成 がグラフの下部に詳細表示されます。

選択された run.png を示すスクリーンショット。

[フォーカス] モードでは、ビジュアルを拡大し、詳細を確認することができます。 ビジュアルが少し混み合っていて、それだけを拡大して見たいことがあるでしょう。 この機能は、フォーカス モードを使用するのに最適です。

詳細を表示するフォーカス モードを示すスクリーンショット。

バーが赤でマークされている場合は、その実行インスタンスに対して例外が検出されています。 [異常] パネルで、このインスタンスの合計期間期間 (期待値)潜在的な原因の情報を表示できます。

異常 panel.png を示すスクリーンショット。