Skip to content

Excel e statistica: funzioni statistiche, tabelle pivot e Power Query

Funzioni statistiche, tabelle pivot e Power Query: strumenti per eseguire calcoli, analizzare e preparare i dati in modo semplice, rapido ed efficiente.

Picture of Federica D'Incà

Federica D'Incà

Medical Writing & Scientific Communication Executive
Un ricercatore utilizza excel per fare analisi statistiche

Nello scorso articolo abbiamo parlato di tabelle dati e formattazione condizionale, strumenti utili per semplificare e ottimizzare la lettura dei dati in Excel (leggi qui l’articolo: Excel e la statistica: tabelle di dati e formattazione condizionale).

Oggi esploreremo funzionalità più avanzate che permettono di sfruttare appieno il potenziale del software nell’elaborazione dei dati: le funzioni, le tabelle pivot e Power Query.

Le funzioni statistiche fondamentali

Le funzioni in Excel sono formule predefinite che eseguono specifiche operazioni matematiche, statistiche o logiche sui dati presenti nelle celle del foglio di lavoro. Queste funzioni possono essere utilizzate per eseguire calcoli complessi, elaborare grandi quantità di dati e ottenere risultati rapidi ed accurati. Excel offre una vasta gamma di funzioni, suddivise in categorie come Matematica e Trigonometria, Statistica, Logica, Testo, Data e Ora, Database e molte altre.

Per iniziare ad utilizzare Excel per l’analisi statistica, è importante comprendere le funzioni statistiche fondamentali. Ecco una panoramica di alcuni delle funzioni statistiche più importanti e ampiamente utilizzate:

  • MEDIA: è una delle funzioni più semplici e utili in Excel. Consente di calcolare la media aritmetica di un insieme di numeri. Questo è utile per ottenere una stima del valore medio di un insieme di dati e comprendere la tendenza centrale dei dati.
  • ST: calcola la deviazione standard di un insieme di dati, che rappresenta la dispersione intorno alla media. Una deviazione standard più alta indica una maggiore variabilità nei dati, mentre una deviazione standard più bassa indica una maggiore coerenza tra i dati.
  • MEDIANA: restituisce il valore centrale di un insieme di dati ordinati. Questo è particolarmente utile quando si lavora con dati che potrebbero essere influenzati da valori estremi o outlier.
  • MODA: restituisce il valore più frequente in un insieme di dati. È utile per identificare i valori più comuni all’interno di un set di dati e comprendere le tendenze prevalenti.
  • CORRELAZIONE: calcola il coefficiente di correlazione tra due set di dati. Questo coefficiente misura la forza e la direzione della relazione tra le variabili. È utile per identificare le relazioni tra le variabili e comprendere se e quanto sono correlate.
  • LIN: esegue un’analisi di regressione lineare sui dati, che è un metodo statistico utilizzato per identificare la relazione lineare tra una variabile dipendente (output) e una o più variabili indipendenti (dette anche covariate o regressori, predittori o variabili di input).
  • C e VAR.P: stimano la varianza (la dispersione dei dati intorno alla media) sulla base di un campione o sull’intera popolazione, rispettivamente. Una varianza più alta indica una maggiore variabilità nei dati, mentre una varianza più bassa indica una maggiore coerenza tra i dati.

Va infine ricordato che oltre alle funzioni statistiche di base, Excel offre una serie di funzioni più avanzate (ad esempio T.TEST, TEST.CHI.QUAD…) che consentono di eseguire analisi statistiche più complesse.

Tabelle pivot e l’analisi dinamica dei dati

Una tabella pivot è uno strumento statistico che consente di riepilogare, analizzare ed esplorare grandi quantità di dati in modo semplice e conciso. Lo strumento non modifica in realtà il foglio di calcolo o il database, ma semplicemente fa “pivot” ovvero “ruota” i dati per visualizzarli da prospettive diverse. Le tabelle pivot risultano quindi particolarmente utili quando si desidera creare report dinamici e interattivi. Con le tabelle pivot, gli utenti possono:

  • facilmente riepilogare e aggregare i dati in base a criteri specifici come somme, medie, conteggi, ecc.
  • modificare rapidamente la visualizzazione dei dati aggiungendo o rimuovendo campi, riorganizzando i dati e creando calcoli personalizzati
  • creare rapidamente tabelle incrociate, per visualizzare la distribuzione congiunta di due o più variabili.

Power Query: trasformazione e manipolazione dei dati

Power Query è un componente di Excel che consente agli utenti di importare, trasformare e caricare dati da diverse fonti prima di analizzarli in Excel. Utilizzando efficacemente Power Query, gli utenti possono migliorare il flusso di lavoro, risparmiare tempo prezioso e ottenere risultati migliori nelle loro attività di analisi dei dati. Questo strumento è particolarmente utile quando si lavora con dati provenienti da più fonti o quando i dati richiedono una certa preparazione prima di poter essere analizzati.

Con Power Query, è possibile connettersi facilmente e rapidamente a database, file di testo, fogli di lavoro Excel, file XML, file CSV e molte altre fonti dati. Una volta importati i dati, Power Query offre una serie di strumenti per pulire e trasformare i dati, inclusi filtri, ordinamenti, unione di tabelle, eliminazione di righe duplicate, trasformazioni di testo e molto altro ancora. Power Query consente inoltre di impostare l’aggiornamento automatico dei dati importati in base a una pianificazione specifica. Questo assicura che i dati siano sempre aggiornati e riflettano le informazioni più recenti disponibili.

Utilizzati insieme, le funzioni, le tabelle pivot e Power Query permettono agli utenti di massimizzare l’efficacia di Excel nell’analisi e nella gestione dei dati. Le funzioni forniscono gli strumenti necessari per eseguire calcoli e analisi sui dati, mentre le tabelle pivot consentono di esplorare e analizzare i dati in modo dinamico. Power Query offre la flessibilità di importare e preparare dati provenienti da diverse fonti. Con una solida comprensione di queste potenti funzionalità, gli utenti possono migliorare il flusso di lavoro, risparmiare tempo prezioso e ottimizzare analisi dei dati.

Picture of Federica D'Incà

Federica D'Incà

Medical Writing & Scientific Communication Executive

I nostri servizi associati a questo tema

Iscriviti alla newsletter di Clariscience

Articoli consigliati

Sebbene il “Response to Reviews Document” sia forse il documento più temuto – o addirittura detestato – nel processo di…
La randomizzazione è una procedura statistica che, applicata nell’ambito degli studi clinici, assegna in modo casuale i partecipanti a diversi…
Una fiera è un evento di settore, a rilevanza locale, nazionale o internazionale, durante il quale le aziende hanno l’opportunità…
Uno studio retrospettivo rappresenta una tipologia di ricerca basata sull’esame e l’analisi di dati pre-esistenti.

Desideri avere maggiori informazioni sui nostri servizi?

Invia la tua domanda per l’evento Q&A di Clariscience dedicato agli affari regolatori

Il 27 giugno alle 11:30 risponderemo alle tue domande in diretta

Invia la tua domanda per l’evento Q&A di Clariscience dedicato alle indagini cliniche

Il 21 novembre alle 11:30 risponderemo alle tue domande in diretta

SERVIZI

Desideri avere maggiori informazioni sui nostri servizi.

ABOUT US

Corporate

Scopri quali sono i valori alla base della nostra azienda, l’ecosistema all’interno del quale operano le persone che lavorano con noi, l’approccio che adottiamo nel rapporto con il cliente e le iniziative liberali selezionate e sostenute negli anni.

Work with us

Informati su eventuali posizioni aperte, invia la tua candidatura spontanea e scopri quali sono le caratteristiche dei profili professionali di chi già lavora con noi.

Programma segnalatori

Se operi nel settore life science, c’è una nuova opportunità che ti aspetta. Partecipando al Clariscience Referral Program potrai mettere a frutto economicamente la tua esperienza e la tua rete di contatti.

Desideri avere maggiori informazioni sui nostri servizi?