3 Ottobre 2017

5 minute read

P-value: come leggere ed interpretare la significatività statistica

3 Ottobre 2017

Indice Show

Il p-value è sotto 0.05, sei sicuro che la tua ipotesi sia correttamente dimostrata? Secondo molti, un p-value significativo è la chiave di volta per spiegare ogni fenomeno. Siamo proprio sicuri che sia sempre così? Per rispondere alla domanda circa la corretta dimostrazione dell’ipotesi di ricerca e quindi derivare dalla sua risposta la positiva risoluzione dello studio sperimentale, bisogna innanzitutto capire cosa indicano il p-value e la sua “famigerata” soglia del 5%.

Il valore di p è utilizzato quale strumento di lettura dei test statistici. Protagonista di tutti gli studi che siano di statistica medica o di econometria, il p-value compare in ogni angolo. Ma, a differenza del pensare classico circa la valenza, oserei dire la supremazia del p-value, la statistica come scienza che studia i dati fonda sul p-value e sul concetto di significatività solo una parte della sua certezza. Un valore di p minore di 0.05 non significa che la tua ipotesi è vera. Così come un valore di p maggiore di 0.05 non comporta che la tua ipotesi sia errata.

Il p-value: il grande risolutore per i test statistici

Gli studenti di statistica sono pratici con molti degli strumenti e dei test statistici più diffusi: chi quadro, t-test, U Mann-Whitney sono solo alcuni dei nomi più popolari di test statistici in statistica inferenziale. Tutti questi strumenti sono accomunati da un indicatore: il p-value e la conseguente significatività. Il valore di p rappresenta il dramma di moltissimi studenti: come si legge questo p-value? Come deve essere il suo valore: inferiore o superiore alla soglia fissata?

La risposta a quest’ultima domanda è: dipende! La statistica così come tutta la scienza, non fonda la sua forza su preconcetti, ma su ipotesi. Per sapere cosa comporta un p-value maggiore di 0.05 o minore di 0.05, la risposta dipende da cosa stai cercando e da cosa vuoi dimostrare! Nella maggior parte dei test il p-value minore di 0.05 è fondamentale; altre volte non è male un p-value maggiore. Dipende tutto dall’ipotesi del test statistico che stai adoperando!

Il termine p-value sta ad indicare il valore di probabilità. Più concretamente esso indica la probabilità che quanto stiamo sostenendo sia corretto con un piccolo margine di errore. Oppure esso spiega che la probabilità di sbagliarsi è troppo alta per sostenere la veridicità di quello che ipotizziamo.

P-value minore di 0.05

Supponi di voler dimostrare che il peso dei pazienti sottoposti ad uno specifico regime dietetico migliora dopo un certo periodo. Per fare ciò, potresti creare un gruppo di controllo, ossia un gruppo di pazienti con caratteristiche alle baseline simile in tutto e per tutto a quello di trattamento, ma non sottoposto a quella specifica dieta. Lo scopo di un tale study design sarebbe dimostrare che la dieta migliora il peso dei pazienti, ipotizzando che il peso del gruppo di trattamento alla fine del periodo di dieta è inferiore a quello del gruppo di controllo.

Hai notato come ho differenziato l’ipotesi di ricerca dall’ipotesi statistica? Per saperne di più leggi l’articolo dedicato.

Poiché in generale il peso tende, almeno sui campioni con una buona numerosità campionaria, a distribuirsi normalmente, possiamo utilizzare il test t per valutare la differenza in media tra i due gruppi. La classica lettura del test t prevede che se il p-value è superiore alla soglia fissata (classica la soglia del 5%, ossia 0.05), allora significa che non vi è differenza statistica sulla variabile peso tra i due gruppi, mentre se, al contrario, il p-value è inferiore a 0.05 (p < 0.05), allora c’è differenza statisticamente significativa tra i due gruppi. Leggendo i valori in media, possiamo anche dedurre che se il peso del primo gruppo è inferiore a quello del secondo, allora è possibile affermare che effettivamente, salvo fattori confondenti o cause di bias, lo specifico regime dietetico sperimentato riduce il peso. Insomma c’è significatività.

P-value < 0.05: problema risolto ed ipotesi di ricerca dimostrata?

Per molti studenti e ricercatori, dimostrare la significatività del test statistico è di per sé sufficiente per affermare che lo studio è stato dimostrato. Tuttavia, specialmente nel caso delle pubblicazioni scientifiche, tale certezza si può trovare molto presto a fare i conti con le domande dei revisori. Questi ultimi, esperti nel loro specifico ambito e particolarmente allenati a riconoscere le pecche degli studi scientifici, possono chiedere di dimostrare, numeri alla mano, che la significatività sostenuta nei risultati non sia una sovrastimata.

Nei ricercatori alle prime armi, il primo impatto con tale genere di richiesta è la rabbia, il secondo il rifiuto, il terzo è lo sconforto. La domanda del revisore è l’inizio di un baratro statistico. Ma, se guardiamo attentamente e con un pò di calma, la domanda non preclude l’accettazione dell’articolo. Essa è infatti finalizzata a spingere l’autore a rinforzare le sue ipotesi. La domanda infatti è il punto di avvio per dimostrare potenza del campione ed effect size, ossia è quel passaggio necessario per far capire che la significatività dimostrata non è fondata nella sabbia, ma nella più forte e solida roccia della comprensione di cosa si stia statisticamente sostenendo.

I concetti di potenza ed effect size sono il corredo necessario della significatività in quanto consentono di capire se le differenze statistiche segnalate dal test siano il frutto di una certezza o di una sovrastima dell’effetto, ossia di un qualcosa che apparentemente sembra esserci, ma di fatto si tramuta in un nulla di fatto alla prima seria prova di validità. In altre parole, il p-value ci consente di capire se vi sono differenze statistiche, ma non dà la certezza assoluta di aver ragione.

Cosa succede se il p-value è maggiore di 0.05?

Dunque il p-value minore di 0.05 non è fonte di certezza, ma cosa dire di un p-value maggiore di 0.05? Ritorniamo qui al discorso del dipende. Ci sono alcuni casi in cui un p-value superiore alla soglia di 0.05 non solo è positivo, ma per semplificare il lavoro statistico successivo è auspicabile. Un esempio classico è il p-value del test di normalità Shapiro-Wilk.

L’ipotesi nulla del test di Shapiro-Wilk afferma che la variabile osservata è distribuita normalmente, ossia se ciò è vero possiamo applicare tutti i più belli test statistici, dal test t di Student fino alla correlazione di Pearson, per non parlare dell’uso di tali variabili in modelli di regressione. Ma se questa è l’ipotesi nulla, come vorremmo il p-value? Ovviamente maggiore di 0.05, ossia un p-value che ci consenta di affermare che non vi è alcuna evidenza che la variabile sia distribuita in modo non-normale. Un p-value minore di 0.05 ci costringerebbe a rifiutare l’ipotesi nulla e dunque perdere quel bellissimo apporto che le variabili distribuite normalmente forniscono ai ricercatori, specialmente quelli più inesperti.

Attenzione alle ipotesi

Prima di concludere voglio farti notare un particolare: nel sostenere l’ipotesi nulla, non ho affermato che la variabile si distribuisce normalmente, ma ho scritto che non ho prova che non si distribuisca normalmente. In altri termini, il p-value superiore allo 0.05 non fornisce un nuovo scenario, ma consente solo di affermare ciò che non posso sostenere perché non ci sono prove.

Tale concetto vale sia per il test di normalità sia per il precedente test t. Tornando all’esempio precedente del confronto del peso di due gruppi di pazienti (trattamento vs. controllo), nel caso l’esito dell’analisi di significatività del test t fosse un p > 0.05, non possiamo affermare che i due gruppi sono uguali, ma possiamo unicamente affermare che non vi è evidenza statistica (significatività) che essi siano diversi. Questo è un passaggio statistico fondamentale. Alcuni studi con un p-value non significativo concludono che due fenomeni comparati sono uguali. Tale interpretazione, per svariate ragioni, inclusa la dimensione del campione, non può scaturire unicamente dal valore di p-value. Essa deve essere il risultato di un percorso logico che tiene conto di altri elementi statistici.

Marilù Garo

Ciao, sono Marilù Garo. Mathsly è uno studio di consulenza statistica e matematica, il cui scopo è elaborare analisi statistiche e fornire assistenza e supporto statistico per gli studi di ricerca e pubblicazioni scientifiche. Periodicamente il sito pubblica guide e articoli per spiegare gli aspetti più interessanti della statistica medica, della ricerca medica, dell'econometria ed in generale della ricerca scientifica. Puoi trovare informazioni sui principali indici statistici (e.g. media, mediana, deviazione standard, ...) e sugli strumenti più idonei a dimostrare le ipotesi di ricerca e a capire molti concetti statistici (e.g. p-value, regressioni, sensibilità, specificità, ...). Pubblico regolarmente articoli in biostatistica, econometria, statistica medica, ed in molti altri settori di applicazione della matematica e della statistica e, più in generale, nella ricerca scientifica. Se preferisci "far fare" ad uno professionista, sono la persona giusta per te. Posso aiutarti ad elaborare i dati e la tua analisi statistica, anche nel caso ti servisse per pubblicazione scientifica sulle riviste più importanti del tuo settore di ricerca. Le mie conoscenze nell'ambito statistico e matematico mi permettono di portare avanti collaborazioni continuative con università e centri ricerca, italiani ed internazionali. Puoi visionare alcune delle pubblicazioni scientifiche quale co-autore nella pagina "Le mie pubblicazioni" o scorrere le recensioni dei clienti con i quali ho collaborato. Inoltre, grazie all'esperienza acquisita nel campo della ricerca, posso aiutarti nellastesura e/o correzione del tuo testo scientifico, anche in inglese, o a scrivere il protocollo di ricerca per il tuo studio. Ti invito ad esplorare il mio sito e a scoprire in quanti modi posso aiutarti nel tuo lavoro di ricerca.

Perchè affidarsi ad un professionista per l'analisi statistica?

17 Settembre 2017

Perché affidarsi ad un analista statistico?

13 Ottobre 2017

Statistica

73 Posts

View Posts

Statistica medica

40 Posts

View Posts

Ricerca Scientifica

37 Posts

View Posts

Econometria

17 Posts

View Posts

Cookie	Durata	Descrizione
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

The Latest

Controllo statistico della qualità e breve intro su Six Sigma

Henrietta Lacks: etica e scienza

Interrupted Time Series: un approccio per quasi-experimental studies

Paradosso di Simpson: scambiare lucciole per lanterne

P-value: come leggere ed interpretare la significatività statistica

Indice Show

Il p-value: il grande risolutore per i test statistici

P-value minore di 0.05

P-value < 0.05: problema risolto ed ipotesi di ricerca dimostrata?

Cosa succede se il p-value è maggiore di 0.05?

Attenzione alle ipotesi

Perchè affidarsi ad un professionista per l'analisi statistica?

Perché affidarsi ad un analista statistico?

Controllo statistico della qualità e breve intro su Six Sigma

Henrietta Lacks: etica e scienza

P-value: come leggere ed interpretare la significatività statistica

Indice Show

Il p-value: il grande risolutore per i test statistici

P-value minore di 0.05

P-value < 0.05: problema risolto ed ipotesi di ricerca dimostrata?

Cosa succede se il p-value è maggiore di 0.05?

Attenzione alle ipotesi

Perchè affidarsi ad un professionista per l'analisi statistica?

Perché affidarsi ad un analista statistico?

Related Posts

Cookies Policy