Come eseguire una buona panel analysis

La panel analysis (o analisi panel) è la grande protagonista di molteplici studi di econometria. Tecnica affermata ormai da molti anni, essa consente di elaborare modelli complessi.

Introduzione

Secondo Greene (2008) e Wooldridge (2009), la scelta dello strumento econometrico è la base per l’elaborazione di un’analisi non distorta, ossia idonea a spiegare nel migliore dei modi le nostre ipotesi di ricerca.

I dati panel

Per procedere alla creazione di una panel analysis, bisogna innanzitutto chiarire cosa sono i dati panel. Più specificatamente, i dati panel sono dati un pò speciali, non per il loro contenuto, ma per la loro composizione. Un panel è costituito da più osservazioni ripetute per più periodi temporali e per uno stesso individuo.

Sembra difficile, vero? Allora, semplifichiamo con un esempio! Immagina di avere di fronte a te 100 soggetti e di osservare il loro reddito annuo e la loro spesa in beni di consumo per 5 anni. Se provi ad inserire i dati in un file Excel, quello che verrà fuori sarà questo tipo di tabella:

id_soggettoid_annoredditospesa
1primo anno….
1secondo anno….
1terzo anno
1quarto anno
1quinto anno
2primo anno
2secondo anno
2terzo anno
2quarto anno
2quinto anno
Modello Dataset Excel per Dati Panel

Come puoi notare dalla tabella, nella colonna c’è il numero di riferimento per i singoli soggetti (valore che va da 1 a 100), nella seconda colonna ci sono gli anni (dal primo al quinto) ed infine nelle ultime due colonne ci sono le due variabili osservate.

Se abbiamo 100 individui osservati per più anni, il nostro dataset sarà composto da 500 osservazioni (ossia 500 righe di Excel).

Analisi panel: passiamo all’elaborazione

A questo punto, come si passa dal dataset ad una bellissima panel analysis, pronta per il tuo studio? In effetti, il percorso è un pò complesso, ma se applicato in modo rigoroso ti consentirà di arrivare alla soluzione.

La creazione di uno studio statistico efficiente prevede una meticolosa scelta degli strumenti statistici. Infatti, creare uno studio con strumenti non adeguati comporta due pericolosi effetti: la distorsione dei risultati e lo stravolgimento dei fondamenti della disciplina. Uno degli errori più comuni che vengono commessi dai neofiti della statistica è quello di dimostrare dei risultati statistici che sono in contrasto con le teorie affermate da altri studi e ritenute universalmente valide. Per esempio, è come dimostrare una nuova legge fisica, invalidando la teoria della relatività di Einstein! Beh, se non sei proprio sicuro delle tue asserzioni, è meglio non provarci! 🙂

I presupposti per la panel analysis

Il primo passo per la panel analysis è quello di mettere in atto una semplicissima regressione lineare OLS. Sì, hai capito benissimo: la cara e semplice regressione lineare. Generalmente, quando si immagina di eseguire una panel analysis, la regressione lineare è multipla, ossia con più variabili indipendenti ed una dipendente.

Fai girare una OLS nel tuo software statistico e poi sottoponi i risultati a verifica con il test di Ramsey. Questo test è infatti uno dei principali discriminanti che ti farà capire se la tua OLS iniziale sia valida o meno. In generale, quando si lavora con i dati panel, il test di Ramsey restituisce un p-value (eh sì proprio lui) minore di 0.05. Insomma, il rifiuto dell’ipotesi nulla del test di Ramsey, ti consentirà di affermare che una semplice OLS non è sufficiente per spiegare la variabilità dei tuoi dati.


Test di Ramsey

Il test di Ramsey pone come ipotesi nulla quella secondo cui i dati non sono affetti da problemi da variabile omessa. Rifiutare l’ipotesi nulla (p < 0.05) porta ad affermare che è necessario uno strumento più forte dell’OLS per catturare la variabilità che incide sulla variabile dipendente a causa delle variabili omesse.


Passiamo alla panel analysis

Bene adesso che sappiamo che i nostri dati hanno problema di variabili omesse, bisogna passare ad eseguire la panel analysis. La procedura negli attuali software statistici è abbastanza semplice ed immediata. Con STATA ad esempio, basta seguire una serie di comandi molto schematici e la panel analysis viene fuori.

Le capacità della tecnologia, sebbene fantastiche e necessarie, non sono però sostitutive del pensiero umano. Al tuo software statistico hai fornito dei numeri, e lui, molto diligentemente, ti ha restituito dei numeri. Ma questi numeri sono adeguati a spiegare il fenomeno che stai osservando? E stanno descrivendo veramente il fenomeno, oppure sono numeri “a caso” stampati da un computer?

Per cominciare a rispondere, bisogna innanzitutto capire che se il modello panel analysis che hai scelto è adeguato. Esistono sostanzialmente due grandi tipologie di panel analysis: la panel ad effetti fissi (fixed effects) e quella ad effetti random (random effects). Per capire quale delle due è corretta per i tuoi dati, è necessario implementare un altro test: il test di Hausmann. Se il p-value del test di Hausmann è minore di 0.05, allora sceglierai di eseguire e presentare una panel ad effetti fissi, altrimenti ti dedicherai ad eseguire una panel ad effetti random.


Test di Hausman

Il test di Hausmann pone come ipotesi nulla quella secondo cui la differenza nei coefficienti non è sistematica. Rifiutare l’ipotesi nulla (p < 0.05) porta ad affermare che la differenza nei coefficienti della panel anlysis è sistematica, ossia il modello è caratterizzato da effetti fissi.


Dopo aver scelto la panel analysis adatta ai tuoi dati, puoi procedere con la sua spiegazione. A seconda che la panel sia ad effetti fissi o random, è necessario sottoporre a test il modello finale. Eterogeneità, dipendenza cross-sectional, correlazione seriale, … stanno dietro l’angolo per invalidare il tuo lavoro.

Ultimo decisivo passo dopo aver eseguito l’elaborazione ed averla sottoposta a test, è quello di capire se il tuo modello econometrico è idoneo a rappresentare il fenomeno osservato. In termini numerici, tutto fila per il verso giusto. Adesso tocca a te e al modello economico che sta alla base dello studio (vedi rapporto tra modello econometrico ed economico) spiegare se la panel che hai tracciato spiega il fenomeno.

Conclusione

Eseguire una buona panel analysis è molto semplice. Il difficile della strada statistico-econometrica non è di per sè elaborare i numeri. Conoscere come uno strumento statistico lavora è necessario per poter interpretare i numeri e fare la differenza tra un studio qualsiasi ed uno degno di citazione!


Hai bisogno di un supporto statistico?

Torna in alto