Elaborare un’analisi statistica: guida rapida per non statistici

Come elaborare un’analisi statistica ben fatta? Obiettivo di questo articolo è cercare di capire come trasformare un dataset di dati in un output che dica “qualcosa” e che non sia unicamente un report (peraltro noioso) di numeri e tabelle.

Conosci il tuo dataset per avviare lo studio

Punto di partenza per elaborare un’analisi statistica è la raccolta dati e dunque la creazione di un dataset (foglio Excel). In particolare, il dataset deve contenere le variabili in colonna e le osservazioni (o unità statistiche) in riga. Mi raccomando il contrario, i dati in colonna e le variabili in riga non consentono di fare un’analisi statistica. Quindi, se questo è un errore che riscontri nel tuo dataset, allora inverti righe con colonne e metti in ordine.

Avere un dataset non è però di per sé sufficiente per capire cosa puoi fare con i tuoi dati. Passo necessario per impostare una buona analisi statistica è quello di conoscere i tuoi dati, anche quando hai 1.000.000 di unità statistiche. Devi sapere punti di forza e di debolezza. Se e quali osservazioni si comportano in modo anomalo e perché lo fanno. Insomma, conoscere i tuoi dati è fondamentale.

Elaborare un’analisi statistica, ossia descrivere i dati

Uno dei mezzi efficaci per conoscere i dati è la statistica descrittiva. A molti appare come un’ovvietà dello studio statistico o una sorta di “deve esserci”. Queste sono credenze sbagliate: un’analisi descrittiva ben fatta dice molto del tuo dataset e ti consente di ampliare le conoscenze suoi tuoi dati, andando a cogliere quelle “particolarità” che ad occhio non vedi.

Una buona descrizione dei dati distingue tra dati qualitativi e quantitativi: attenzione a non fare la media della variabile Genere. Ne ho viste tante medie e deviazioni standard tra maschio e femmine e … non è stato un bel vedere!

Scegliere lo strumento statistico per relazioni e confronti

Il passo numero 3 della nostra elaborazione è quello di scegliere lo strumento più adatto per capire cosa dicono i dati. La statistica ha una quantità enorme di opportunità ed ogni giorno qualcuno ne inventa una nuova. Se dimostri relazioni, sicuramente il punto di partenza è una classica OLS, ma a seconda del tuo studio, non è la soluzione più efficace perché troppo semplice e può non tenere conto di alcuna caratteristiche del tuo studio.

Per dimostrare le differenze tra due o più gruppi, esistono test parametrici, non parametrici, ANOVA ad una via o a due vie, controlli post ANOVA e potrei continuare per un bel pezzo! Se ami la correlazione tra variabili, scegli tra almeno due test: Pearson e Spearmann. A seconda dei dati, applica quello giusto.

Quali e quante variabili includere

Scelto lo strumento, devi decidere quali e quante variabili devono essere coinvolte nello studio: più variabili significa più lavoro per elaborare la tua analisi statistica e non solo. La regressione ad esempio, prevede il rispetto del principio di parsimonia (leggi qui per un simpatico aneddoto), ossia che utilizzi tutte le variabili che partecipano alla spiegazione della relazione, ma non una di più. Altrimenti si cade in un pericoloso circolo vizioso in cui troppe variabili sono superflue e “sporcano” il risultato.

Se effettui un confronto, attenzione a cosa confronti e come lo confronti. Se hai dati qualitativi e fai un confronto tra medie sei completamente fuori strada! Analogamente, se hai dati quantitativi e fai un test del chi-quadro, anche qui hai bisogno di un “buon navigatore statistico”. Per approfondimenti vedi la pagina di Statistica Inferenziale.

Concludi l’elaborazione, ossia interpreta i numeri

Ultimo passo è: ma cosa concludiamo con questi dati? Cosa significano per il nostro studio? Statisticamente sono attendibili? Si tratta di domande importanti per capire se ciò che abbiamo calcolato numericamente sia congruo con quelle che sono le linee guida del nostro studio o con la letteratura di riferimento. Ad un software statistico abbiamo dato numeri e lui ci ha restituito dei numeri (famosi output), ma se essi siano veri, reali, attendibili, questo spetta a noi e al nostro consulente statistico.


Related Posts