Freigeben über


Verwenden der Tools zur Datenprofilerstellung

Die Tools zur Datenprofilerstellung bieten neue und intuitive Möglichkeiten zum Bereinigen, Transformieren und Verstehen von Daten im Power Query Editor. Dazu gehören:

  • Spaltenqualität

  • Spaltenverteilung

  • Spaltenprofil

Um die Tools zur Datenprofilerstellung zu aktivieren, gehen Sie auf die Registerkarte Ansicht im Menüband. Aktivieren Sie in Power Query Desktop die gewünschten Optionen in der Gruppe Datenvorschau, wie in der folgenden Abbildung dargestellt.

Screenshot of the Data profiling tools selected under the Power Query View tab.Screenshot der Datenprofilierungstools, die auf der Registerkarte Power Query Abfrage ausgewählt wurden.

Wählen Sie in Power Query Online Datenansicht, und aktivieren Sie dann die gewünschten Optionen in der Dropdown-Liste.

Screenshot of the data profiling tools selected under Data view in the View tab.Screenshot der Datenprofilierungstools, die unter Datenansicht auf der Registerkarte Ansicht ausgewählt wurden.

Nachdem Sie die Optionen aktiviert haben, werden die Datenprofilinformationen im Power Query-Editor angezeigt.

Screenshot of the data profiling tools after they're set up.Screenshot der Datenprofilierungstools nach der Einrichtung.

Hinweis

Standardmäßig führt Power Query dieses Daten-Profiling für die ersten 1.000 Zeilen Ihrer Daten durch. Um den gesamten Datensatz zu bearbeiten, wählen Sie die Meldung Column profiling based on top 1000 rows in der unteren linken Ecke des Editor-Fensters, um die Spaltenprofilierung in Column profiling based on entire dataset zu ändern.

Spaltenqualität

Die Spalte Qualitätsmerkmal kennzeichnet Werte in Zeilen in fünf Kategorien:

  • Gültig, grün dargestellt.

  • Fehler, in rot dargestellt.

  • Leer, in dunkelgrau dargestellt.

  • Unbekannt, in gestricheltem Grün dargestellt. Zeigt an, dass bei Fehlern in einer Spalte die Qualität der übrigen Daten unbekannt ist.

  • Unerwarteter Fehler, in gestricheltem Rot dargestellt.

Diese Indikatoren werden direkt unter dem Namen der Spalte als Teil eines kleinen Balkendiagramms angezeigt.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Screenshot der erweiterten Ansicht des Balkendiagramms mit Datenqualitätsindikatoren und Bezeichnungen über jeder Spalte in der Tabelle.

Die Anzahl der Datensätze in jeder Spaltenqualitätskategorie wird auch als Prozentsatz angezeigt.

Wenn Sie mit dem Mauszeiger über eine der Spalten fahren, wird Ihnen die numerische Verteilung der Qualität der Werte in der Spalte angezeigt. Zusätzlich können Sie durch Auswahl der Ellipsen-Schaltfläche (...) einige Schnellaktionsschaltflächen für Operationen mit den Werten öffnen.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Screenshot der Spalte Verteilung der Namen mit 701 gültigen Namen (100 Prozent), null Fehlern und null leeren Namen, mit angezeigten Befehlen für schnelle Aktionen.

Spaltenverteilung

Diese Funktion bietet eine Reihe von visuellen Darstellungen unterhalb der Spaltennamen, die die Häufigkeit und Verteilung der Werte in jeder Spalte zeigen. Die Daten in diesen Visualisierungen sind absteigend sortiert, beginnend mit dem Wert mit der höchsten Häufigkeit.

Screenshot of the data profiling tools with the upper column distribution emphasized.Screenshot der Datenprofilierungstools mit hervorgehobener Verteilung in der oberen Spalte.

Wenn Sie den Mauszeiger über die Verteilungsdaten in einer der Spalten bewegen, erhalten Sie Informationen über die Gesamtdaten in der Spalte (mit eindeutiger Anzahl und eindeutigen Werten). Distinct bezieht sich auf die Gesamtzahl der unterschiedlichen Werte in jeder Spalte. Eindeutig bezieht sich auf Werte, die nur einmal in der Spalte vorkommen. Sie können auch auf die Ellipsen-Schaltfläche klicken und aus einem Menü mit verfügbaren Operationen wählen.

Screenshot of the data profiling tools with the column distributions options emphasized.Screenshot der Datenprofilierungstools mit hervorgehobenen Optionen für die Spaltenverteilung.

Spaltenprofil

Diese Funktion ermöglicht eine genauere Betrachtung der Daten in einer Spalte. Neben dem Säulenverteilungsdiagramm enthält es auch ein Säulenstatistikdiagramm. Diese Informationen werden unterhalb des Abschnitts "Datenvorschau" angezeigt.

Screenshot of the data profiling tool with the column profile emphasized.Screenshot des Datenprofilierungstools mit hervorgehobenem Spaltenprofil.

Nach Wert filtern

Sie können mit dem Wertverteilungsdiagramm auf der rechten Seite interagieren und jeden der Balken auswählen, indem Sie mit dem Mauszeiger über die Teile des Diagramms fahren.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Screenshot, der zeigt, wie man mit der Maus über den Balken in einem Balkendiagramm zur Werteverteilung fährt, das die einzelnen Daten für diesen Balken anzeigt.

Klicken Sie mit der rechten Maustaste, um eine Reihe von verfügbaren Transformationen für diesen Wert anzuzeigen.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Screenshot, der zeigt, wie das Kontextmenü mit den verfügbaren Transformationen für einen einzelnen Balken im Wertverteilungs-Balkendiagramm angezeigt wird.

Kopieren von Daten

In der oberen rechten Ecke der Abschnitte Spaltenstatistik und Werteverteilung können Sie die Ellipsenschaltfläche (...) auswählen, um ein Kontextmenü Kopieren anzuzeigen. Wählen Sie diese Option, um die in einem der beiden Bereiche angezeigten Daten in die Zwischenablage zu kopieren.

Screenshot of the copy shortcut menu in the column statistics column.Screenshot des Kontextmenüs für Kopien in der Spalte Statistik.

Gruppe nach Wert

Wenn Sie die Ellipsen-Schaltfläche (...) in der oberen rechten Ecke des Werteverteilungsdiagramms wählen, können Sie zusätzlich zu Kopieren auch Gruppieren nach wählen. Diese Funktion gruppiert die Werte in Ihrem Diagramm nach einer Reihe von verfügbaren Optionen.

Screenshot of the copy and group by shortcut menu in the value distribution column.Screenshot der Kopie und Gruppieren nach Kontextmenü in der Spalte Wertverteilung.

Das folgende Bild zeigt eine Spalte mit Produktnamen, die nach Textlänge gruppiert sind. Nachdem die Werte im Diagramm gruppiert werden, können Sie mit einzelnen Werten im Diagramm interagieren, wie unter Filter nach Wert beschrieben.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Screenshot des neuen Balkendiagramms, das die Verteilung der Textlänge der Storenamen in der Spalte Tabellenname zeigt.