Power Queryには旧エクセルの「104万行」の壁がありません。ですから大量のデータも手軽に扱えるのが魅力です。ところが、Power Queryエディタ(以降、エディタ)では、旧エクセルのように、ショートカットキーを活用してデータ内を端から端まで散策するようなことができません。ですので、エディタ内ではデータ全体を把握しずらいのです。
しかも行数が1000行以上だと全ての行は表示されないようになっています
これは大量のデータがあっても、素早く動くようにするための工夫ですが、ユーザーにとっては不便です。
但し「散策」できない点を補完する機能がエディタ内の「表示タブ」にあります。今回は「表示タブ」での「補完機能」について解説します
今回解説する補完機能の内容は次の3つになります
上の3つは、どれも「表示」タブ内の簡単な操作で把握できる内容になっています
では、今回解説する内容について紹介したところで、詳細な解説をはじめます
1.列数を把握する
「一体、このデータはどこまで右に続くのか?」
列数があまりに多いと、最終列を探す旅にでかけなくてはなりません
前述の表示タブでは、少なくとも「列数」はすぐに把握できます
表示タブの左下に列数が表示されています
こちは、行数についても「1,000行以下」であれば表示されています
2.データの行数を1目で把握する
Power Queryのエディタ内では、1000行以上は表示されないように工夫されています
ですから、フィルタで1000行以上を見ようとしても上の画像のように「値が上限の1000個に到達しました」と表示されます
この場合には、まず「表示」タブの「列のプロファイル」にチェックを入れます
すると、選択した列(上の画像だと職員データ.氏名)の行数が画面左下に表示されます
但し、行数が1000以上あると「1000」と表示されてしまいます
ですので、画面下のこちらの表示箇所を操作します
下のGIF画像のように、上の画像の「上位1000行に基づく列のプロファイリング」を「データセット全体に基づくプロファイル」に切り替えます
切り替えた後には、下の画像のように正確な行数が表示されます
3.エラーの発生数を1目で把握する
ある列でどの位のエラーが発生しているのか(品質)を確認するには、表示タブ内で「列の品質」にクリックを入れます
もし、具体的にエラーの発生件数を知りたい場合には、2.で紹介した「列のプロフィル」にチェックを入れておけば、下の画像のように件数も表示されます
もし、行数が1000件以上ある場合には、2.で前述したように画面下を「データセット全体に基づく列のプロファイル」に設定しておいてください
今回は以上です
ちなみに私が今回使用したエクセルのバージョンは以下です
今回解説した機能はバージョン2019から実装された機能です
最後まで記事を読んで下さり、ありがとうございました
コメントを残す