次の方法で共有


SparkソフトウェアのDAGで高価な読み込みを識別する

DAG へのアクセス

高価な作業を前提に考えると、まずは読み取りを行っているステージの ID が必要です。 ここでは、ステージ ID が 194 であることがわかります。

ステージ ID

次に、SQL DAG にアクセスする必要があります。 ジョブのページの上部までスクロールし、[ 関連付けられた SQL クエリ] をクリックします。

SQL ID

これで DAG が表示されます。 そうでない場合は、少しスクロールすると表示されます。

SQL DAG

場合によっては、DAG に従って、データのソースを確認できます。 それ以外の場合は、次のように指定したステージ ID を探します。

DAG の SQL ステージ

次に、"スキャン" ノードを探す必要があります。 この場合、 transactionsという名前のテーブルを読み取っていることを伝えるのは非常に簡単です。

DAG でのスキャン

場合によっては、ノードをクリックまたはロールオーバーして、読み取るデータの場所を取得する必要があります。