Deviazione Standard: co-protagonista dell’analisi dati

La deviazione standard, indicata anche nella sua forma abbreviata dev. st. e conosciuta anche con il nome di scarto quadratico medio, è la co-protagonista della maggior parte delle analisi statistiche. Il suo ruolo, sebbene appaia a molti come di secondo piano, è fondamentale per capire come si distribuiscono i nostri dati. Scopriamo qualcosa di più su di essa.

Deviazione standard e Varianza

La deviazione standard ha origine dalla varianza, ossia dalla principale misura di variabilità della statistica descrittiva. Essa è precisamente definita come la radice quadrata della varianza, ossia:

\[\text{deviazione standard} = \sqrt{\text{varianza}}\]

La scelta di utilizzare la prima e non la varianza per spiegare la variabilità dei dati deriva dal fatto che la varianza è meno intuitavamente comprensibile. Infatti, supponiamo che la nostra variabile ha come unità di misura i chilogrammi (kg). Ovviamente la media delle osservazioni di X è espressa sempre in kg. Quando andiamo a calcolare la varianza, poiché per il suo calcolo eleviamo i valori al quadrato, ne deriva che la varianza non è più espressa in kg, ma in kg2, di difficile interpretazione. Per ovviare a ciò, si calcola la deviazione standard, la quale appunto riporta i kg2 a kg tramite l’estrazione di radice quadrata.

Il ruolo della deviazione standard

Essa è una misura necessaria in ogni lavoro statistico. Essa deve essere sempre espressa e riportata. Solo leggendo il suo valore possiamo sapere se i nostri dati hanno un’ampia o una ridotta variabilità.

Secondo alcune stime, la maggior parte delle distribuzioni presenta le osservazioni entro il range di una volta dev. st. (68% delle osservazioni), mentre solo il 5% delle osservazioni cade al di fuori di due volte la dev. st. Ovviamente nel caso di distribuzioni fortemente asimmetriche, tale regola non è vera.

Deviazione o Errore Standard

In alcuni casi la deviazione standard è confusa con l’errore standard, tanto che i dati descrittivi di una variabile sono riportati come media ed errore standard. Sebbene l’errore si ricavi anche conoscendo la deviazione, il loro campo di azione è completamente diverso.

La prima esprime la variabilità delle osservazioni di un campione, mentre l’errore standard esprime la variabilità dei dati di più campioni.

Conclusioni

La deviazione standard completa le informazioni della media. Ricordando la poesia del poeta Trilussa che diceva che “seconno le statistiche d’adesso
risurta che te tocca un pollo all’anno: / e, se nun entra nelle spese tue, / t’entra ne la statistica lo stesso / perch’è c’è un antro che ne magna due
“, leggendo la variabilità attraverso lo scarto quadratico medio capiremmo che la media da sola non è la reale rappresentazione della realtà (per approfondimento puoi leggere l’articolo: “Quando la media inganna“) e che bisogna prestare attenzione ai numeri e al loro contesto, evento possibile anche conoscendo la deviazione standard.


Torna in alto