Che lo si ami o che lo si detesti, Excel è uno dei programmi più diffuso e popolari per chi si occupa di analisi dei dati, ovvero quel processo di pulizia, trasformazione, elaborazione ed interpretazione dei dati grezzi (raw data) con lo scopo di evidenziare ed estrarre informazioni significative da insiemi di dati complessi.
Excel è uno strumento di facile utilizzo le cui funzionalità, tra cui le tabelle dati, le tabelle pivot e le varie funzioni statistiche, svolgono un ruolo fondamentale nel semplificare e ottimizzare l’analisi dei dati, consentendo agli utenti di importare, esplorare, pulire, analizzare e visualizzare i dati in modo semplice, rapido ed efficiente.
In questo articolo vi illustreremo brevemente due funzionalità base dell’analisi dei dati in Excel, le tabelle dati e la formattazione condizionale, che vi aiuteranno a organizzare i dati e renderli fruibili ad analisi statistiche più complesse.
Tabelle
I dati possono essere sottoforma di “intervallo dati” (matrice di valori inserita in un intervallo di celle di una pagina del foglio di lavoro) o “tabella dati” (una serie di righe e di colonne contenente dati correlati e gestiti in maniera del tutto indipendente dalle rimanenti informazioni presenti sul foglio di lavoro). Contrariamente all’intervallo dati, la tabella dati è un oggetto strutturato e dinamico che permette di semplificare la gestione e l’analisi di un gruppo di dati correlati, garantendo l’integrità delle informazioni in essa contenute. È possibile creare una tabella a partire dalla scheda “Inserisci” o trasformare un intervallo dati in una tabella Excel con il comando da tastiera CTRL+T. Quando si crea una tabella, Excel assegna automaticamente un nome predefinito (successivamente modificabile) alla tabella e ad ogni intestazione di colonna nella tabella. La combinazione di nomi di tabella e colonne è detta riferimento strutturato. Quando si immette una formula su Excel, i riferimenti strutturati vengono visualizzati automaticamente, facilitando l’uso delle formule stesse nonché l’individuazione delle tabelle in una cartella di lavoro grande.
Le tabelle dati presentano caratteristiche e automatismi progettati per rendere l’attività di gestione dei dati comoda, rapida ed efficiente. Essendo un oggetto dinamico, le tabelle dati si adattano autonomamente all’aggiunta/eliminazione di record/campi, modifiche di titoli, valori, formule o layout. La scheda dedicata sulla barra multifunzione contiene, inoltre, diversi strumenti che consentono, ad esempio, di rinominare la tabella, creare una tabella pivot agganciata alla tabella dati, rimuovere duplicati, inserire un filtro dati, modificare lo stile della tabella con un layout preimpostato o personalizzato, ed esportare i dati. Prima di immergersi in analisi statistiche complesse, è necessario assicurarsi che i dati siano puliti e organizzati. Attraverso questi strumenti, le tabelle di Excel consentono di ordinare e filtrare i dati con molta facilità, eliminando duplicati, valori mancanti o valori anomali che potrebbero alterare i risultati e compromettere l’integrità dell’analisi.
Formattazione condizionale
Per evidenziare e identificare rapidamente informazioni rilevanti o anomalie all’interno dei dati, Excel mette a disposizione la formattazione condizionale. Questa funzionalità rappresenta un vero e proprio strumento di analisi dati che può essere applicato ad intervalli di dati e tabelle (incluse tabelle pivot), per impostare specifici attributi di formattazione del testo (ad esempio, stile dei bordi e colore di sfondo delle celle, tipo di carattere, dimensione del carattere), sulla base di regole, preimpostate o personalizzabili.
Il programma mette a disposizione le seguenti regole “pronte all’uso” e stili predefiniti:
- “Regole evidenziazione celle” per individuare e formattare le celle
- con valore superiore, inferiore o uguale a un altro valore specificato
- con valore compreso tra due valori di riferimento
- con valore/testo duplicato
- con una determinata stringa testo (anche un solo carattere)
- con data corrispondente a una data specificata
- “Regole primi/ultimi valori” per individuare e formattare i primi o gli ultimi “n” valori di una serie
- “Barre dei dati”, “scale di colori” e “set di icone” per visualizzare, a colpo d’occhio, come si pone il valore di una cella rispetto alle altre.
In alternativa, è possibile impostare una regola personalizzata (“Nuova regola”) selezionando il tipo di formattazione condizionale desiderato.
Padroneggiare le tabelle dati e la formattazione condizionale non vi renderà degli esperti, ma vi permetterà di risparmiare tempo e semplificare notevolmente la lettura dei dati. Nel prossimo articolo ci addentreremo in funzionalità più “avanzate” di analisi dei dati (funzioni, tabelle pivot e power query)… se volete approfondire questi aspetti, restate “sintonizzati”.