P-value: come leggere ed interpretare la significatività statistica

Il p-value è sotto 0.05, sei sicuro di avere ragione? Per rispondere a questa domanda e derivarne quindi la significatività del test statistico ed in alcuni casi dello studio, bisogna capire cosa indica il p-value e la sua “famigerata” soglia del 5%.

Il valore di p è utilizzato quale strumento di lettura dei test statistici. Protagonista di tutti gli studi che siano di statistica medica o di econometria, il p-value appare ad ogni angolo. La statistica come scienza che studia i dati fonda sul p-value e sul concetto di significatività solo una parte della sua certezza: un valore di p minore di 0.05 non significa che hai ragione, né tanto meno un valore di p maggiore di 0.05 significa che hai torto.

Il p-value: il grande risolutore per i test statistici

Gli studenti di statistica sono pratici con molti degli strumenti e dei test statistici più diffusi: chi quadro, t-test, U Mann-Whitney sono solo alcuni dei nomi più popolari di test statistici in statistica inferenziale. Tutti questi strumenti sono accomunati da un indicatore comune: il p-value e la conseguente significatività. Il valore di p rappresenta il dramma di moltissimi studenti: come si legge questo p-value? Come deve essere il suo valore: inferiore o superiore alla soglia fissata?

La risposta a quest’ultima domanda è: dipende! Dipende da cosa stai cercando, da cosa vuoi dimostrare! Nella maggior parte dei test il p-value minore di 0.05 è fondamentale; altre volte non è male un p-value maggiore. Dipende tutto dall’ipotesi del test statistico che stai usando!

Mettiamo un pò di ordine.

Il termine p-value sta ad indicare il valore di probabilità. Più concretamente esso indica la probabilità che quanto stiamo sostenendo sia corretto con un piccolo margine di errore oppure la probabilità di sbagliarsi è troppo alta per sostenere la veridicità di quello che ipotizziamo.

Se ad esempio vogliamo dimostrare che dati due gruppi – ad esempio il primo sottoposto ad una particolare dieta e il secondo libero da qualsiasi dieta – il loro peso, dopo un periodo di osservazione di dieta o non dieta, è differente (per esempio il peso del gruppo a dieta è più basso di quello del secondo gruppo), allora utilizzeremo il test t per l’analisi delle differenze in media. Se il p-value è superiore alla soglia fissata, all significa che non vi è differenza statistica tra i due gruppi, mentre se, al contrario, esso è minore, allora c’è differenza statisticamente significativa e se il peso del primo gruppo è inferiore a quello del secondo, allora possiamo affermare che effettivamente la dieta riduce il peso rispetto all’assenza di dieta. Insomma c’è significatività. Successivamente, il dato deve essere confermato attraverso la potenza del campione (il mio campione è veramente valido?) e l’effect size (qual è la portata dei miei risultati?). 

Dunque il p-value ci consente di capire se vi sono differenze statistiche tra gruppi, ma non dà la certezza assoluta di aver ragione. Ci permette di capire se un risultato è statisticamente significativo senza assurgere a verità assoluta.

Il p-value superiore a 0.05

In alcuni casi un valore di p-value > 0.05 è un’ottima notizia per il nostro studio. E’ quello che accade nel test Shapiro-Wilk di normalità. L’ipotesi nulla afferma che la variabile osservata è distribuita normalmente. Ciò significa che quando accettiamo l’ipotesi nulla (p > 0.05) stiamo affermando che non vi è alcuna evidenza che la variabile sia distribuita in modo non-normale. 

Ti faccio notare quest’ultima interpretazione. A fronte di un p-value > 0.05 non affermo che la variabile si distribuisce normalmente, ma affermo unicamente che non ho prova che non si distribuisca normalmente. 

Cosa significa quando il p-value è maggiore di 0.05?

Leggendo l’ultima affermazione circa il p-value sulla distribuzione di normalità della variabile, ti faccio notare come il p-value quando superiore allo 0.05 non fornisce un nuovo scenario, ma consente solo di affermare ciò che non vediamo.

Mi spiego meglio. Torniamo all’esempio precedente del confronto tra due gruppi di pazienti (sperimentale e di controllo) di cui uno sottoposto a dieta vitaminica. Se dopo l’esperimento, il valore del p del test statistico è superiore a 0.05, non possiamo affermare che i due gruppi sono uguali. Possiamo unicamente affermare che non vi è evidenza statistica (significatività) che essi siano diversi. Questo è un passaggio statistico fondamentale. Molti studi con un p-value non significativo concludono che due fenomeni comparati sono uguali. Tale interpretazione non può scaturire unicamente dal valore di p-value. Essa deve essere il risultato di un percorso logico che tiene conto di altri elementi statistici.


Hai bisogno di un supporto statistico?

Torna in alto