列のデータ型を評価および変更する
任意のデータ ソースからテーブルをインポートすると、Power BI Desktop は最初の 1,000 行 (既定の設定) のスキャンを自動的に開始し、列内のデータの種類の検出を試みます。 Power BI Desktop が正しいデータ型を検出しない状況が発生する場合があります。 データ型が誤っていると、パフォーマンスに問題が発生します。
コンマ区切り値 (.CSV) ファイルや Excel ブック (.XLSX) ファイルなどのフラット ファイルを処理するときは、データがワークシートに手入力されて誤りが発生したため、データ型エラーが発生する可能性が高くなります。 逆に、データベースでは、テーブルやビューを作成するときにデータ型が事前に定義されています。
ベスト プラクティスとしては、データを Power BI セマンティック モデルに読み込む前に、Power Query エディターで列のデータ型を評価することです。 データ型が正しくないと判断した場合は、データ型を変更できます。 また、列の値に書式を適用し、列の概要作成の既定値を変更することもできます。
レポート作成の準備として売上データをクリーニングして変換するシナリオを続けるには、列を評価して、正しいデータ型であることを確実にする必要があります。 明らかになったエラーを修正する必要があります。
OrderDate 列を評価します。 予想どおり、数値データが含まれていますが、Power BI Desktop によって列のデータ型が誤ってテキストに設定されています。 この列をレポートするには、データ型をテキストから日付に変更する必要があります。
不適切なデータ型の影響
次の情報は、Power BI が正しいデータ型を検出しない場合に発生する可能性のある問題の概要を示しています。
データ型が正しくないと、特定の計算の作成、階層の派生、あるいは他のテーブルとの適切なリレーションシップの作成ができなくなります。 たとえば、Quantity of Orders YTD を計算しようとすると、OrderDate 列のデータ型が日付 (時間ベースの計算に必要) でないことを示す次のエラーが表示されます。
Quantity of Orders YTD = TOTALYTD(SUM('Sales'[OrderQty]), 'Sales'[OrderDate])
日付フィールドに正しくないデータ型が適用された場合のもう 1 つの問題は、年、月、または週単位でデータを分析可能にする、日付階層を作成できなくなることです。 次のスクリーンショットには、SalesDate フィールドが日付型として認識されず、テーブル ビジュアルに日付の一覧としてのみ表示されることが示されています。 しかし、日付テーブルを使用し、[自動の日付/時刻] をオフにして、自動生成された階層を取り除くことをお勧めします。 このプロセスの詳細については、自動生成されたデータ型に関するドキュメントを参照してください。
列のデータ型の変更
列のデータ型は、Power Query エディターと、列ツールを使用して Power BI Desktop レポート ビューの 2 つの場所で変更できます。 データを読み込む前に、Power Query エディターでデータ型を変更することをお勧めします。
Power Query エディターで列のデータ型を変更する
Power Query エディターでは、列のデータ型を 2 つの方法で変更できます。 方法の 1 つは、問題のある列を選択し、変換 タブで データ型 を選んでから、一覧から正しいデータ型を選択します。
別の方法としては、列ヘッダーの横にあるデータ型アイコンを選択し、リストから正しいデータ型を選択できます。
Power Query エディターで行った他の変更と同様、列のデータ型に対して行った変更は、プログラムされたステップとして保存されます。 この手順は変更された型と呼ばれ、データが更新されるたびに反復されます。
データのクリーンアップと変換のすべての手順を完了したら、閉じて適用 を選択して Power Query エディターを閉じ、変更をセマンティック モデルに適用します。 この段階で、データは分析とレポート作成に最適な形になっているはずです。
詳細については、Power BI Desktop のデータ型を参照してください。