16 Maggio 2019

2 minute read

Come si calcola il coefficiente di determinazione: R quadro (R2)

16 Maggio 2019

Riprendiamo in questo articolo il concetto di coefficiente di determinazione (vedi precedente post) imparando come si calcola l’R². Innanzitutto precisiamo che il coefficiente è una delle due misure di bontà di adattamento dello stimatore OLS. Esso ha il compito di calcolare quanto la stima OLS della retta di regressione multipla è in grado di descrivere i dati. Nell’analisi di regressione esistono due forme di R2: quello classico e quello cd. “corretto”.

Definizione e calcolo R²

In termini statistici esso è dato dalla frazione della varianza campionari di y_i predetta dai regressori x_i. In formule matematiche esso è dato dal rapporto tra due somme di quadrati:

R² = ESS/TSS

in cui ESS è la somma spiegata dei quadrati e TSS è la somma totale dei quadrati.

La somma spiegata dei quadrati (ESS) è data dalla somma delle differenze tra i valori predetti di y e la media della stessa variabile dipendente.

La somma totale dei quadrati (TSS) è invece data dalla somma delle differenze tra i valori originari di y e la media della stessa variabile.

Hai notato la differenza tra le due somme? Rivedi le due definizioni ponendo attenzione alla due parti in grassetto.

La formula può essere migliorata prendendo in considerazione la somma dei quadrati dei residui SSR, per cui si ha che:

R² = 1 – (SSR/TSS)

in cui SSR è la somma dei quadrati dei residui.

Definizione e calcolo R² corretto

L’R² corretto è una versione modificata dell’R² classico ed è utilizzato per deflazionare l’R² così che aggiungendo una variabile l’aumento del valore del coefficiente di determinazione sia realmente un miglioramento del modello di regressione e non un mero effetto numerico che sovrastima la bontà di adattamento. Il vantaggio dell’R² corretto è che risente positivamente dell’aggiunta di un nuovo regressore solo quando questo consente un effettivo miglioramento del modello. Ciò è possibile grazie alla sua formulazione matematica:

R² adj = 1 – ((n-1/n-k-1) · (SSR/TSS))

in cui n è la numerosità campionaria e k è il numero dei regressori.

Perché utilizzare la forma corretta (nota come adjusted?

Abbiamo detto che il coefficiente di determinazione nella forma “corretta” consente di avere una bontà di adattamento del modello che sia non inflazionata dal numero dei regressori utilizzati. Tale evidenza discende dalla stessa formulazione matematica:

il rapporto (n-1)/(n-k-1) è sempre maggiore di 1 e questo fa sì che l’R2 corretto sia sempre minore dell’R2 classico;
aggiungendo un regressore vie è una diminuzione di SSR ed un aumento del rapporto (n-1)/(n-k-1).

Marilù Garo

Ciao, sono Marilù Garo. Mathsly è uno studio di consulenza statistica e matematica, il cui scopo è elaborare analisi statistiche e fornire assistenza e supporto statistico per gli studi di ricerca e pubblicazioni scientifiche. Periodicamente il sito pubblica guide e articoli per spiegare gli aspetti più interessanti della statistica medica, della ricerca medica, dell'econometria ed in generale della ricerca scientifica. Puoi trovare informazioni sui principali indici statistici (e.g. media, mediana, deviazione standard, ...) e sugli strumenti più idonei a dimostrare le ipotesi di ricerca e a capire molti concetti statistici (e.g. p-value, regressioni, sensibilità, specificità, ...). Pubblico regolarmente articoli in biostatistica, econometria, statistica medica, ed in molti altri settori di applicazione della matematica e della statistica e, più in generale, nella ricerca scientifica. Se preferisci "far fare" ad uno professionista, sono la persona giusta per te. Posso aiutarti ad elaborare i dati e la tua analisi statistica, anche nel caso ti servisse per pubblicazione scientifica sulle riviste più importanti del tuo settore di ricerca. Le mie conoscenze nell'ambito statistico e matematico mi permettono di portare avanti collaborazioni continuative con università e centri ricerca, italiani ed internazionali. Puoi visionare alcune delle pubblicazioni scientifiche quale co-autore nella pagina "Le mie pubblicazioni" o scorrere le recensioni dei clienti con i quali ho collaborato. Inoltre, grazie all'esperienza acquisita nel campo della ricerca, posso aiutarti nellastesura e/o correzione del tuo testo scientifico, anche in inglese, o a scrivere il protocollo di ricerca per il tuo studio. Ti invito ad esplorare il mio sito e a scoprire in quanti modi posso aiutarti nel tuo lavoro di ricerca.

Come calcolare il coefficiente di correlazione

5 Maggio 2019

Biostatistica e medicina

19 Maggio 2019

Cookie	Durata	Descrizione
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

The Latest

Controllo statistico della qualità e breve intro su Six Sigma

Henrietta Lacks: etica e scienza

Interrupted Time Series: un approccio per quasi-experimental studies

Paradosso di Simpson: scambiare lucciole per lanterne

Come si calcola il coefficiente di determinazione: R quadro (R2)

Definizione e calcolo R²

Definizione e calcolo R² corretto

Perché utilizzare la forma corretta (nota come adjusted?

Come calcolare il coefficiente di correlazione

Biostatistica e medicina

Controllo statistico della qualità e breve intro su Six Sigma

Henrietta Lacks: etica e scienza

Come si calcola il coefficiente di determinazione: R quadro (R2)

Definizione e calcolo R2

Definizione e calcolo R2 corretto

Perché utilizzare la forma corretta (nota come adjusted?

Come calcolare il coefficiente di correlazione

Biostatistica e medicina

Related Posts

Cookies Policy

Definizione e calcolo R²

Definizione e calcolo R² corretto