Excel Power Queryの13個の重要な機能

データクリーニング

大量のデータがまとめましたが、分析と並べ替えを行わない場合、あまり役に立たない可能性があります。Powerqueryは、百万行以上、さらには数億行のデータをインポートできるだけでなく、重要なのは、簡単にこれらのデータを処理して、必要なデータを見つけます。

インポートされたデータの整理過程は、一般に「データクリーニング」と呼ばれます。クリーニングと呼ばれる理由は、データアナリストの眼中には、乱雑なデータはダーティデータであり、クリーニングされた後にのみ分析できるためです。これから、PowerQueryの強力なデータクリーニング機能について理解しましょう。次の手順は、PowerBIとExcelの両方に適用できます。

ヘッダーの位置を上げる

Excelでは、最初の行がヘッダー行であり、データは2行目のから始まりますが、PQでは、最初の行からデータレコードであり、ヘッダーはデータの上にあります。

PQでヘッダーを昇格する

これより、Excelからデータをインポートする最初のステップは、ヘッダーを昇格します。[1行目をヘッダーとして使用]をクリックして最初の行をヘッダーとして使用すると、ヘッダーが昇格されます。

最初の行の横にあるドロップダウンボタンをクリックし、ヘッダーが最初の行になるボタンがあり、ヘッダーが降格される役割を果たします。この機能も特に便利です。この機能については、下で説明します。

データ型の変更

データ型の変更は非常に簡単ですが、正しいデータ型を設定することは非常に重要です。後期のデータモデリングおよび視覚化の過程では、予期しないエラーが発生する可能性があります。最終的に、データ型の設定が間違ったことは原因となります。最初からデータ型を設定する良い習慣を培うべきです。 データ型を設定する方法は2つがあります。

PQでデータ型を変更します

エラー/空の値を削除する

データがインポートされた後、エラー(Error)または空の値(null)が発生する可能性があります。

PQでnull値とエラーを削除します

データを分析する前に、右側の効果を実現したい場合は、それらを無効にする必要があります。操作は次のとおりです。

重複した内容を削除する

PQでは、重複の削除は非常に簡単です。重複した行を選択し、右クリックして[重複の削除]を選択します。

PQで重複した内容を削除します

コピー

Excelデータではセルがマージされ、インポート後に空になることがよくあります。

PQでコピーします

PQで[下]を選択すればいいです。

列のマージ

PQでマージする列を選択し、[変換]タブで[列のマージ]をクリックし、[列のマージ]ウィンドウがポップアップ表示されます。

PQで列のマージ

上記の図のように、[種類]と[項目]をマージします。

分割

分割は列をマージする逆の操作ですが、より多くの機能があります。文字数または区切り記号による分割することを選択できます。列に複数の区切り記号が含まれている場合は、分割する位置の区切り記号を指定できます。

PQ分割

マージされた列を分割すると、マージする前の形式になります。

グループ化

これは、Excelのグループ化機能に相当します。例えば、今のデータから第1四半期の合計金額を計算する場合、[グループ化]をクリックします。

PQグループ化

対応する引数を入力すると、グループ化が完了します。

抽出

PQの抽出機能は、長さ、最初の文字、最後の文字、範囲などに従って抽出できます。例えば、次の例では、最初の5文字を抽出します。

PQ抽出

入れ替え

データ処理では、行と列の間で変換する必要がある場合があります。たとえば、各項目を列ラベルに、四半期を行ラベルに変換します。入れ替えをクリックします。

PQ入れ替え

何かおかしいと思いませんでしたか? 四半期がなくなりました。これは、転置時にデータの一部のみが転送され、四半期がデータ範囲にないためです。四半期を保持する場合は、最初に月を降格する必要があります。ここでは[ヘッダーを1行目として使用]をクリックします。上記で説明しました。

ヘッダーが降格されると、転置できます。

転置は完了しましたが、[1行目をヘッダーとして使用]をクリックし、ヘッダーを昇格する必要があります。

行と列の操作

PQの行と列の操作は非常に柔軟で、大量のデータに適します。

PQ行と列の操作

列のピボット解除

これはPQの非常に便利な機能です。データ分析の必要性から、2次元テーブルを1次元テーブルに変換することがよくあります。昔は、Excelで完了するのに多くの手順が必要でした。ピボット解除機能によって、ワンボタンで一次元のテーブルに降格します。

PQ列のピボット解除

列のピボット

分析には1次元のテーブルが必要であり、表示のニーズには、1次元のテーブルをExcelのデータピボットである2次元のテーブルに変換する必要があることがよくあります。PQでは、ワンボタンでピボットもできます。1次元テーブルを元に変更する場合、集計方法では「集計しない」を選択してください。

PQ列のピボット

[OK]をクリックして、元の2次元テーブルに復元します。

上記は最も基本的で常用なデータクリーニング機能です。非常に簡単ですが、実際の操作によりよく習得できます。熟練した後、ほとんどのデータ処理ができます。これらはPower BIの必要なスキルだけではありません。短時間でExcelの操作能力も大幅に向上させることができます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です