Modelli di regressione

Quando si parla di regressione, la statistica presenta una varietà enorme di strumenti. Scegliere quello che è più adatto alle proprie esigenze e ai propri dati non è semplice. Dimmi dove vuoi andare e vedremo come arrivarci: non esistono strade precostituite e non esistono due studi identici. Ogni volta sarà sempre necessario controllare che il modello adottato sia quello giusto. In un mare di possibilità, ho creato una mini-guida su come regolarsi. Basta una sola informazione per individuare il modello generale da applicare.

Quale modello di regressione scegliere?

Prima di “avventurarsi” nell’elaborazione dei modelli di regressione, è necessario osservare la propria variabile dipendente. A seconda di che tipo di dato è, sapremo sempre identificare il modello e quindi conoscere i vantaggi e gli svantaggi. Quello che trovi di seguito è un elenco di modelli possibili di regressione, impostati secondo un ordine di difficoltà crescente. Se non sei pratico con la statistica, il primo è sempre il più facile ed il più diffuso. 

Variabile dipendente continua

Quando la variabile dipendente è continua (quantitativa continua) i modelli di regressione principali sono:

  • regressione semplice o multivariata
  • ANOVA/MANOVA
  • Constrain linear model
  • Kernel regression
  • Tobit regression
  • Interval regression
  • Truncated regression
  • Box-Cox regression
  • Quantile regression
  • Mixed-effects linear regression
  • Finite Mixture Models.

Variabile dipendente binaria (o dummy).

Quando la variabile dipendente è una variabile binaria (altresì detta “dummy”) e quindi può assume solo uno dei due valori possibili (solitamente indicati con 0 e 1), i modelli di regressione principali sono:

  • regressione logistica
  • regressione probit
  • Finite mixture model
  • Kernel regression.

Variabile dipendente: ordinale

Nel caso in cui la variabile dipendente sia una variabile che assume valori discreti (quali primo, secondo e terzo) i principali modelli di regressione sono:

  • ordered logistic regressione
  • ordered probit regression
  • rank-ordered logistic regression
  • rank-ordered probit regression
  • multilevel ordered probit regression
  • multilevel ordered logistic regression
  • ordered logistic regression with finite mixture models
  • ordered probit regression with finite mixture models
  • zero-inflated ordered probit regression, …

Variabile dipendente: categoriale

Quando la variabile dipendente è una variabile di tipo categoriale (e.g. femmina/maschio), i modelli di regressione sono la multinomial logistic regression e la multinomial probit regression.

Variabile dipendente: conteggio.

Infine, quando la variabile dipendente è un conteggio i principali modelli di regressione sono: poisson regression e negative binomial regression, in tutte le forme possibili (zero-inflated, truccate, censore, multilevel o finite mixture models).

Conclusione

Ogni modello di regressione ha al suo interno una varietà di assunzioni da rispettare. A seconda del tipo di dato, ogni modello richiede una particolare verifica circa la sua applicabilità. Conoscere ogni modello e sapere come esso sta lavorando sui dati, è obbligo di ogni ricercatore per assicurare la correttezza dei risultati e la loro credibilità.