Quando si parla di regressione, la statistica presenta una varietà enorme di strumenti. Scegliere quello che è più adatto alle proprie esigenze e ai propri dati non è semplice. Dimmi dove vuoi andare e vedremo come arrivarci: non esistono strade precostituite e non esistono due studi identici. Ogni volta sarà sempre necessario controllare che il modello adottato sia quello giusto. In un mare di possibilità, ho creato una mini-guida su come regolarsi. Basta una sola informazione per individuare il modello generale da applicare.
Quale modello di regressione scegliere?
Prima di “avventurarsi” nell’elaborazione dei modelli di regressione, è necessario osservare la propria variabile dipendente. A seconda di che tipo di dato è, sapremo sempre identificare il modello e quindi conoscere i vantaggi e gli svantaggi. Quello che trovi di seguito è un elenco di modelli possibili di regressione, impostati secondo un ordine di difficoltà crescente. Se non sei pratico con la statistica, il primo è sempre il più facile ed il più diffuso.
Variabile dipendente continua
Quando la variabile dipendente è continua (quantitativa continua) i modelli di regressione principali sono:
- regressione semplice o multivariata
- ANOVA/MANOVA
- Constrain linear model
- Kernel regression
- Tobit regression
- Interval regression
- Truncated regression
- Box-Cox regression
- Quantile regression
- Mixed-effects linear regression
- Finite Mixture Models.
Variabile dipendente binaria (o dummy).
Quando la variabile dipendente è una variabile binaria (altresì detta “dummy”) e quindi può assume solo uno dei due valori possibili (solitamente indicati con 0 e 1), i modelli di regressione principali sono:
- regressione logistica
- regressione probit
- Finite mixture model
- Kernel regression.
Variabile dipendente: ordinale
Nel caso in cui la variabile dipendente sia una variabile che assume valori discreti (quali primo, secondo e terzo) i principali modelli di regressione sono:
- ordered logistic regressione
- ordered probit regression
- rank-ordered logistic regression
- rank-ordered probit regression
- multilevel ordered probit regression
- multilevel ordered logistic regression
- ordered logistic regression with finite mixture models
- ordered probit regression with finite mixture models
- zero-inflated ordered probit regression, …
Variabile dipendente: categoriale
Quando la variabile dipendente è una variabile di tipo categoriale (e.g. femmina/maschio), i modelli di regressione sono la multinomial logistic regression e la multinomial probit regression.
Variabile dipendente: conteggio.
Infine, quando la variabile dipendente è un conteggio i principali modelli di regressione sono: poisson regression e negative binomial regression, in tutte le forme possibili (zero-inflated, truccate, censore, multilevel o finite mixture models).
Conclusione
Ogni modello di regressione ha al suo interno una varietà di assunzioni da rispettare. A seconda del tipo di dato, ogni modello richiede una particolare verifica circa la sua applicabilità. Conoscere ogni modello e sapere come esso sta lavorando sui dati, è obbligo di ogni ricercatore per assicurare la correttezza dei risultati e la loro credibilità.