Condividi tramite


Utilizzo degli strumenti di profilatura dei dati

Gli strumenti di profilatura dei dati offrono nuovi e intuitivi modi per pulire, trasformare e comprendere i dati in editor di Power Query. Essi includono:

  • Colonna qualità

  • Colonna distribuzione

  • Profilo colonna

Per abilitare gli strumenti di profilatura dei dati, passare alla scheda Visualizza sulla barra multifunzione. In Power Query Desktop abilitare le opzioni desiderate nel gruppo Anteprima dati, come illustrato nell'immagine seguente.

Screenshot of the Data profiling tools selected under the Power Query View tab.Screenshot degli strumenti di profilatura dei dati selezionati nella scheda Visualizzazione Power Query.

In Power Query Online selezionare Visualizzazione dati, quindi abilitare le opzioni desiderate nell'elenco a discesa.

Screenshot of the data profiling tools selected under Data view in the View tab.Screenshot degli strumenti di profilatura dei dati selezionati in Visualizzazione dati nella scheda Visualizza.

Dopo aver abilitato le opzioni, le informazioni di profilatura dei dati vengono visualizzate nell'editor di Power Query.

Screenshot of the data profiling tools after they're set up.Screenshot degli strumenti di profilatura dei dati dopo la configurazione.

Nota

Per impostazione predefinita, Power Query esegue questa profilatura dei dati sulle prime 1.000 righe dei dati. Per fare in modo che funzioni sull'intero set di dati, selezionare la profilatura colonna in base al messaggio delle prime 1000 righe nell'angolo inferiore sinistro della finestra dell'editor per modificare la profilatura delle colonne in Profilatura colonne in Base all'intero set di dati.

Colonna qualità

I valori delle etichette delle caratteristiche di qualità della colonna in righe in cinque categorie:

  • Valido, visualizzato in verde.

  • Errore, visualizzato in rosso.

  • Vuoto, mostrato in grigio scuro.

  • Sconosciuto, mostrato in verde tratteggiato. Indica quando sono presenti errori in una colonna, la qualità dei dati rimanenti è sconosciuta.

  • Errore imprevisto, visualizzato in rosso tratteggiato.

Questi indicatori vengono visualizzati direttamente sotto il nome della colonna come parte di un piccolo grafico a barre.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Screenshot della visualizzazione migliorata del grafico a barre con indicatori di qualità dei dati e etichette sopra ogni colonna della tabella.

Il numero di record in ogni categoria di qualità della colonna viene visualizzato anche come percentuale.

Passando il puntatore del mouse su una delle colonne, viene visualizzata la distribuzione numerica della qualità dei valori in tutta la colonna. Inoltre, selezionando il pulsante con i puntini di sospensione (...) vengono aperti alcuni pulsanti di azione rapida per le operazioni sui valori.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Screenshot della distribuzione della colonna dei nomi con 701 nomi validi (100 percento), zero errori e zero vuoti, con comandi di azione rapida visualizzati.

Colonna distribuzione

Questa funzionalità fornisce un set di oggetti visivi sotto i nomi delle colonne che illustrano la frequenza e la distribuzione dei valori in ognuna delle colonne. I dati in queste visualizzazioni vengono ordinati in ordine decrescente rispetto al valore con la frequenza più elevata.

Screenshot of the data profiling tools with the upper column distribution emphasized.Screenshot degli strumenti di profilatura dei dati con la distribuzione di colonne superiore evidenziata.

Passando il puntatore del mouse sui dati di distribuzione in una delle colonne, si ottengono informazioni sui dati complessivi nella colonna (con conteggio distinto e valori univoci). Distinct fa riferimento al numero complessivo di valori diversi in ogni colonna. Unique fa riferimento a valori che hanno una sola istanza nella colonna. È anche possibile selezionare il pulsante con i puntini di sospensione e scegliere tra un menu di operazioni disponibili.

Screenshot of the data profiling tools with the column distributions options emphasized.Screenshot degli strumenti di profilatura dei dati con le opzioni di distribuzione delle colonne evidenziate.

Profilo colonna

Questa funzionalità fornisce un'analisi più approfondita dei dati in una colonna. Oltre al grafico di distribuzione delle colonne, contiene un istogramma delle statistiche. Queste informazioni vengono visualizzate sotto la sezione anteprima dei dati.

Screenshot of the data profiling tool with the column profile emphasized.Screenshot dello strumento di profilatura dei dati con il profilo di colonna evidenziato.

Filtrare in base al valore

È possibile interagire con il grafico di distribuzione dei valori sul lato destro e selezionare una delle barre passando il puntatore del mouse sulle parti del grafico.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Screenshot che illustra come passare il puntatore del mouse sulla barra nel grafico a barre di distribuzione dei valori, che mostra i singoli dati per tale barra.

Fare clic con il pulsante destro del mouse per visualizzare un set di trasformazioni disponibili per tale valore.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Screenshot che illustra come visualizzare il menu di scelta rapida con le trasformazioni disponibili per una singola barra nel grafico a barre della distribuzione dei valori.

Copiare i dati

Nell'angolo superiore destro delle sezioni statistiche di colonna e distribuzione dei valori è possibile selezionare il pulsante con i puntini di sospensione (...) per visualizzare un menu di scelta rapida Copia . Selezionarlo per copiare i dati visualizzati in entrambe le sezioni negli Appunti.

Screenshot of the copy shortcut menu in the column statistics column.Screenshot del menu di scelta rapida copia nella colonna statistiche colonna.

Raggruppa per valore

Quando si seleziona il pulsante con i puntini di sospensione (...) nell'angolo superiore destro del grafico di distribuzione dei valori, oltre a Copia è possibile selezionare Raggruppa per. Questa funzionalità raggruppa i valori nel grafico in base a un set di opzioni disponibili.

Screenshot of the copy and group by shortcut menu in the value distribution column.Screenshot del menu di scelta rapida copia e gruppo nella colonna distribuzione dei valori.

L'immagine seguente mostra una colonna di nomi di prodotto raggruppati per lunghezza del testo. Dopo aver raggruppato i valori nel grafico, è possibile interagire con i singoli valori nel grafico, come descritto in Filtra per valore.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Screenshot del nuovo grafico a barre che mostra la distribuzione della lunghezza del testo dei nomi degli archivi nella colonna Nomi della tabella.