【分析作業用】大量データを1目で把握する

 Power Queryには旧エクセルの「104万行」の壁がありません。ですから大量のデータも手軽に扱えるのが魅力です。ところが、Power Queryエディタ(以降、エディタ)では、旧エクセルのように、ショートカットキーを活用してデータ内を端から端まで散策するようなことができません。ですので、エディタ内ではデータ全体を把握しずらいのです。Power Queryはこの点は少し不便です。但し「散策」できない点を補完する機能がエディタ内の「表示タブ」にあります。今回は「表示タブ」での「補完機能」について解説します

今回解説する補完機能の内容は次の3つになります

1.データの列数を1目で把握する

2.データの行数を1目で把握する

3.エラーの発生数を1目で把握する

 上の3つは、どれも「表示」タブ内の簡単な操作で把握できる内容になっています

では、今回解説する内容について紹介したところで、詳細な解説をはじめます

1.列数を把握する

「一体、このデータはどこまで右に続くのか?」

列数があまりに多いと、最終列を探す旅にでかけなくてはなりません

前述の表示タブでは、少なくとも「列数」はすぐに把握できます

表示タブの左下に列数が表示されています

こちは、行数についても「1,000行以下」であれば表示されています

2.データの行数を1目で把握する

Power Queryのエディタ内では、1000行以上は表示されないように工夫されています

ですから、フィルタで1000行以上を見ようとしても上の画像のように「値が上限の1000個に到達しました」と表示されます

この場合には、まず「表示」タブの「列のプロファイル」にチェックを入れます

すると、選択した列(上の画像だと職員データ.氏名)の行数が画面左下に表示されます

但し、行数が1000以上あると「1000」と表示されてしまいます

ですので、画面下のこちらの表示箇所を操作します

下のGIF画像のように、上の画像の「上位1000行に基づく列のプロファイリング」を「データセット全体に基づくプロファイル」に切り替えます

切り替えた後には、下の画像のように正確な行数が表示されます

3.エラーの発生数を1目で把握する

ある列でどの位のエラーが発生しているのか(品質)を確認するには、表示タブ内で「列の品質」にクリックを入れます

もし、具体的にエラーの発生件数を知りたい場合には、2.で紹介した「列のプロフィル」にチェックを入れておけば、下の画像のように件数も表示されます

もし、行数が1000件以上ある場合には、2.で前述したように画面下を「データセット全体に基づく列のプロファイル」に設定しておいてください

今回は以上です

ちなみに私が今回使用したエクセルのバージョンは以下です

今回解説した機能はバージョン2019から実装された機能です

最後まで記事を読んで下さり、ありがとうございました

にほんブログ村 資格ブログ ビジネススキルへ
にほんブログ村 IT技術ブログ VBAへ


にほんブログ村

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です