21.06.2013 Views

Modello di regressione lineare multipla (cap.6) - Economia

Modello di regressione lineare multipla (cap.6) - Economia

Modello di regressione lineare multipla (cap.6) - Economia

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Regressione <strong>lineare</strong> <strong>multipla</strong><br />

Eduardo Rossi 2<br />

2 Università <strong>di</strong> Pavia (Italy)<br />

Aprile 2013<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 1 / 32


Outline<br />

1 La <strong>di</strong>storsione da variabili omesse<br />

2 Causalità<br />

3 Misure <strong>di</strong> Goodness-of-Fit<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 2 / 32


Struttura<br />

Distorsione da variabili omesse<br />

Causalità e analisi <strong>di</strong> <strong>regressione</strong><br />

Regressione <strong>multipla</strong> e OLS<br />

Misure <strong>di</strong> adattamento<br />

Distribuzione campionaria dello stimatore OLS<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 3 / 32


La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione da variabili omesse<br />

L’errore u si verifica a causa <strong>di</strong> fattori, o variabili, che influenzano Y ma<br />

non sono inclusi nella funzione <strong>di</strong> <strong>regressione</strong>. Ci sono sempre variabili<br />

omesse.<br />

Talvolta l’omissione <strong>di</strong> queste variabili può portare a una <strong>di</strong>storsione dello<br />

stimatore OLS.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 4 / 32


La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione dello stimatore OLS che si verifica a seguito <strong>di</strong> un fattore,<br />

o variabile, omesso è detta <strong>di</strong>storsione da variabile omessa. Affinchè<br />

si verifichi tale <strong>di</strong>storsione, la variabile omessa Z deve sod<strong>di</strong>sfare due<br />

con<strong>di</strong>zioni:<br />

Le due con<strong>di</strong>zioni per la <strong>di</strong>storsione da variabile omessa<br />

Z è una variable determinante <strong>di</strong> Y (cioè Z è parte <strong>di</strong> u); e<br />

Z è correlata con il regressore X (cioè, Corr(Z, X) > 0).<br />

Entrambe le con<strong>di</strong>zioni devono verificarsi affinchè l’omissione <strong>di</strong> Z porti a<br />

<strong>di</strong>storsione da variabile omessa.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 5 / 32


La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione da variabili omesse<br />

Nell’esempio dei punteggi nei test:<br />

Il livello <strong>di</strong> conoscenza della lingua inglese (se lo studente è <strong>di</strong><br />

madrelingua o meno) verosimilmente influisce sui punteggi nei test<br />

standar<strong>di</strong>zzati: Z è una determinante <strong>di</strong> Y.<br />

Le comunità <strong>di</strong> immigrati tendono a una minore affluenza e quin<strong>di</strong> hanno<br />

budget scolastici inferiori e STR maggiori: Z è correlata con X.<br />

Di conseguenza, è <strong>di</strong>storto. In quale <strong>di</strong>rezione?<br />

Che cosa suggerisce il buon senso?<br />

Se il buon senso vi fa <strong>di</strong>fetto, c’è una formula...<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 6 / 32


La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione da variabili omesse<br />

Formula per la <strong>di</strong>storsione da variabili omesse: si ricor<strong>di</strong> l’equazione<br />

<br />

ˆβ1<br />

i − β1 =<br />

(Xi − ¯ X)ui<br />

<br />

i (Xi − ¯ 1<br />

n i<br />

=<br />

X) 2 vi<br />

<br />

n−1<br />

Dove vi = (Xi − ¯ X)ui ≈ (Xi − µX)ui.<br />

Sotto la prima assunzione dei minimi quadrati,<br />

Ma se<br />

cosa succede?<br />

n<br />

s 2 X<br />

E[(Xi − µX)ui] = Cov(Xi, ui) = 0<br />

E[(Xi − µX)ui] = Cov(Xi, ui) = σXu = 0<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 7 / 32


La <strong>di</strong>storsione da variabili omesse<br />

La <strong>di</strong>storsione da variabili omesse<br />

dove<br />

<br />

ˆβ1<br />

i − β1 =<br />

(Xi − ¯ X)ui<br />

<br />

i (Xi − ¯ X)<br />

σXu<br />

σ 2 X<br />

2 =<br />

= σu<br />

×<br />

σX<br />

σXu<br />

σuσX<br />

1<br />

n<br />

<br />

n−1<br />

n<br />

i vi<br />

<br />

s2 X<br />

= σu<br />

× ρXu<br />

σX<br />

p<br />

→ σXu<br />

σ 2 X<br />

Se vale la prima assunzione, allora ρXu = 0, ma se non vale abbiamo... .<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 8 / 32


La <strong>di</strong>storsione da variabili omesse<br />

Formula della <strong>di</strong>storsione da variabili omesse<br />

ˆβ1<br />

p<br />

→ β1 + σu<br />

ρXu<br />

σX<br />

Se una variabile omessa Z è contemporaneamente:<br />

1 una determinante <strong>di</strong> Y (cioè se è contenuta in u); e<br />

2 correlata con X,<br />

allora ρXu = 0 e lo stimatore OLS ˆ β1 è <strong>di</strong>storto e inconsistente.<br />

Per esempio, i <strong>di</strong>stretti scolastici con pochi studenti non <strong>di</strong> madrelingua<br />

1 ottengono punteggi migliori nei test standar<strong>di</strong>zzati e<br />

2 hanno classi più piccole (budget più elevati), perciò ignorando l’effetto <strong>di</strong><br />

avere molti studenti non <strong>di</strong> madrelingua si arriverebbe a sovrastimare<br />

l’effetto della <strong>di</strong>mensione delle classi.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 9 / 32


La <strong>di</strong>storsione da variabili omesse<br />

Distorsione da variabili omesse<br />

I <strong>di</strong>stretti con meno studenti non <strong>di</strong> madrelingua ottengono migliori<br />

punteggi nei testi.<br />

I <strong>di</strong>strettti con una minore percentuale <strong>di</strong> studenti non <strong>di</strong> madrelingua<br />

hanno classi più piccole.<br />

Tra i <strong>di</strong>stretti con percentuali <strong>di</strong> studenti non <strong>di</strong> madrelingua comparabili,<br />

l’effetto della <strong>di</strong>mensione delle classi è piccolo (si ricor<strong>di</strong> che<br />

complessivamente la <strong>di</strong>fferenza <strong>di</strong> punteggio nei test = 7.4).<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 10 / 32


La <strong>di</strong>storsione da variabili omesse<br />

Causalità e analisi <strong>di</strong> <strong>regressione</strong><br />

L’esempio dei punteggi nei test (STR) e percentuale <strong>di</strong> studenti non <strong>di</strong><br />

madrelingua mostra che, se una variabile omessa sod<strong>di</strong>sfa le due<br />

con<strong>di</strong>zioni della <strong>di</strong>storsione da variabili omesse, allora lo stimatore OLS<br />

nella <strong>regressione</strong> che omette tale variabile è <strong>di</strong>storto e inconsistente.<br />

Perciò, anche se n è grande, non sarà vicino a β1.<br />

Ciò fa sorgere una domanda più profonda: come definiamo β1? Ovvero,<br />

che cosa vogliamo stimare, precisamente, quando eseguiamo una<br />

<strong>regressione</strong>?<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 11 / 32


La <strong>di</strong>storsione da variabili omesse<br />

Che cosa vogliamo stimare quando eseguiamo una<br />

<strong>regressione</strong>?<br />

Esistono (almeno) tre possibili risposte a questa domanda:<br />

Vogliamo stimare la pendenza <strong>di</strong> una retta attraverso un<br />

<strong>di</strong>agramma a nuvola come semplice riepilogo dei dati a cui non associamo<br />

un significato sostanziale. Questo può essere utile talvolta, ma non è<br />

molto interessante a livello intellettuale e non rientra nell’obiettivo <strong>di</strong><br />

questo corso.<br />

Vogliamo effettuare previsioni del valore <strong>di</strong> Y per una unità che non<br />

appartiene all’insieme dei dati, per cui conosciamo il valore <strong>di</strong> X.<br />

Realizzare previsioni è importante per gli economisti, ed è possibile<br />

ottenere previsioni eccellenti utilizzando i meto<strong>di</strong> <strong>di</strong> <strong>regressione</strong> senza la<br />

necessità <strong>di</strong> conoscere gli effetti causali. Torneremo a questo tema più<br />

avanti nel corso.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 12 / 32


La <strong>di</strong>storsione da variabili omesse<br />

Che cosa vogliamo stimare quando eseguiamo una<br />

<strong>regressione</strong>?<br />

Vogliamo stimare l’effetto causale su Y <strong>di</strong> una variazione in X. Si<br />

supponga che il consiglio scolastico decida una riduzione <strong>di</strong> 2 studenti per<br />

classe. Quale sarebbe l’effetto sui punteggi nei test? Questa è una<br />

domanda causale (qual è l’effetto causale sui punteggi nei test <strong>di</strong> STR?)<br />

perciò dobbiamo stimare questo effetto causale. A parte la <strong>di</strong>scussione<br />

dell’attività <strong>di</strong> previsione, lo scopo <strong>di</strong> questo corso è la stima <strong>di</strong> effetti<br />

causali me<strong>di</strong>ante meto<strong>di</strong> <strong>di</strong> <strong>regressione</strong>.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 13 / 32


Causalità<br />

Che cos’è un effetto causale?<br />

La causalità è un concetto complesso!<br />

In questo corso adottiamo un approccio pratico alla definizione <strong>di</strong><br />

causalità:<br />

Un effetto causale è definito come un effetto misurato in un esperimento<br />

controllato casualizzato ideale.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 14 / 32


Causalità<br />

Esperimento controllato causalizzato ideale<br />

Ideale: i soggetti seguono tutti il protocollo <strong>di</strong> trattamento - perfetta<br />

compliance, nessun errore nei report, ecc.!<br />

Casualizzato: i soggetti della popolazione <strong>di</strong> interesse sono assegnati<br />

casualmente a un gruppo <strong>di</strong> trattamento o <strong>di</strong> controllo (così non ci sono<br />

fattori <strong>di</strong> confusione)<br />

Controllato: la <strong>di</strong>sponibilità <strong>di</strong> un gruppo <strong>di</strong> controllo permette <strong>di</strong><br />

misurare l’effetto <strong>di</strong>fferenziale del trattamento<br />

Esperimento: il trattamento è assegnato nell’esperimento: i soggetti non<br />

hanno scelta, perciò non vi è causalità inversa in cui i soggetti scelgono il<br />

trattamento che ritengono migliore.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 15 / 32


Causalità<br />

Esperimento controllato casualizzato ideale<br />

Si immagini un esperimento controllato casualizzato ideale per misurare<br />

l’effetto sui punteggi nei test della riduzione <strong>di</strong> STR...<br />

In tale esperimento gli studenti sarebbero assegnati casualmente alle<br />

classi, che avrebbero <strong>di</strong>mensioni <strong>di</strong>verse.<br />

Poichè gli studenti sono assegnati casualmente, tutte le loro caratteristiche<br />

(e quin<strong>di</strong> gli ui) sarebbero <strong>di</strong>stribuiti in modo in<strong>di</strong>pendente da STRi.<br />

Quin<strong>di</strong>, E[ui|STRi] = 0 - cioè la prima assunzione dei minimi quadrati<br />

vale in un esperimento controllato casualizzato.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 16 / 32


Dati osservazionali<br />

Causalità<br />

Il trattamento non è assegnato in modo casuale<br />

Si consideri PctEL - la percentuale <strong>di</strong> studenti non <strong>di</strong> madrelingua - nel<br />

<strong>di</strong>stretto. Verosimilmente sod<strong>di</strong>sfa i due criteri per la <strong>di</strong>storsione da<br />

variabili omesse: Z = PctEL è:<br />

una determinante <strong>di</strong> Y; e<br />

correlata con il regressore X.<br />

Quin<strong>di</strong> i gruppi <strong>di</strong> controllo e <strong>di</strong> trattamento <strong>di</strong>fferiscono in modo<br />

sistematico, perciò Corr(STR, PctEL) = 0<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 17 / 32


Dati osservazionali<br />

Causalità<br />

Casualizzazione + gruppo <strong>di</strong> controllo significa che qualsiasi <strong>di</strong>fferenza tra<br />

i gruppi <strong>di</strong> trattamento e <strong>di</strong> controllo è casuale – non sistematicamente<br />

correlata al trattamento<br />

Possiamo eliminare la <strong>di</strong>fferenza <strong>di</strong> PctEL tra il gruppo <strong>di</strong> classi gran<strong>di</strong> (<strong>di</strong><br />

controllo) e quello <strong>di</strong> classi piccole (<strong>di</strong> trattamento) esaminando l’effetto<br />

della <strong>di</strong>mensione delle classi tra i <strong>di</strong>stretti con lo stesso valore <strong>di</strong> PctEL.<br />

Se soltanto la <strong>di</strong>fferenza sistematica tra i gruppi <strong>di</strong> classi gran<strong>di</strong> e piccole è<br />

in PctEL, allora torniamo all’esperimento controllato casualizzato –<br />

all’interno <strong>di</strong> ciascun gruppo <strong>di</strong> PctEL.<br />

Questo è un modo per “controlare” per l’effetto <strong>di</strong> PctEL quando si stima<br />

l’effetto <strong>di</strong> STR.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 18 / 32


Causalità<br />

Ancora sulla <strong>di</strong>storsione da variabili omesse<br />

Tre mo<strong>di</strong> per superare la <strong>di</strong>storsione da variabili omesse<br />

Eseguire un esperimento controllato casualizzato in cui il trattamento<br />

(STR) sia assegnato casualmente: allora PctEL è ancora una<br />

determinante <strong>di</strong> TestScore, ma PctEL è incorrelato con STR. (Questa<br />

soluzione è raramente praticabile).<br />

Adottare l’approccio a tabulazione incrociata, con gradazioni più fini <strong>di</strong><br />

STR e PctEL - all’interno <strong>di</strong> ogni gruppo, tutte le classi hanno lo stesso<br />

PctEL, perciò controlliamo per PctEL (ma presto si esauriranno i dati e<br />

che <strong>di</strong>re <strong>di</strong> altre variabili determinanti come il red<strong>di</strong>to famigliare e il<br />

livello <strong>di</strong> istruzione dei genitori?)<br />

Usare una <strong>regressione</strong> in cui la variabile omessa (PctEL) non è più omessa:<br />

includere PctEL come regressore aggiuntivo in una <strong>regressione</strong> <strong>multipla</strong>.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 19 / 32


Causalità<br />

Il modello <strong>di</strong> <strong>regressione</strong> <strong>multipla</strong><br />

Si consideri il caso <strong>di</strong> due regressori:<br />

Yi = β0 + β1X1i + β2X2i + ui, i = 1, 2, . . . , n<br />

Y è la variabile <strong>di</strong>pendente<br />

X1, X2 sono le due variabili in<strong>di</strong>pendenti (regressori)<br />

β0 = intercetta della popolazione ignota<br />

β1 = effetto su Y <strong>di</strong> una variazione in X1, tenendo X2 costante<br />

β2 = effetto su Y <strong>di</strong> una variazione in X2, tenendo X1 costante<br />

ui = errore <strong>di</strong> <strong>regressione</strong> (fattori omessi)<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 20 / 32


Causalità<br />

Interpretazione dei coefficienti nella <strong>regressione</strong> <strong>multipla</strong><br />

Si consideri <strong>di</strong> variare X1, ∆X1 tenendo X2 costante:<br />

Retta <strong>di</strong> <strong>regressione</strong> della popolazione prima della variazione:<br />

Y = β0 + β1X1 + β2X2<br />

Retta <strong>di</strong> <strong>regressione</strong> della popolazione dopo la variazione:<br />

Differenza:<br />

Quin<strong>di</strong>:<br />

tenendo X2 costante<br />

tenendo X1 costante<br />

Y ∆Y = β0 + β1(X1 + ∆X1) + β2X2<br />

∆Y = β1∆X1<br />

β1 = ∆Y<br />

∆X1<br />

β2 = ∆Y<br />

∆X2<br />

β0 = valore predetto <strong>di</strong> Y quando X1 = X2 = 0.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 21 / 32


Causalità<br />

Lo stimatore OLS della<strong>regressione</strong> <strong>multipla</strong><br />

Con due regressori, lo stimatore OLS risolve:<br />

ˆβ0, ˆ β1, ˆ β2 = arg min<br />

β0,β1,β2<br />

n <br />

Yi − (β0 + β1X1i + β2X2i) 2<br />

i=1<br />

Lo stimatore OLS minimizza la <strong>di</strong>fferenza quadratica me<strong>di</strong>a tra i valori<br />

attuali <strong>di</strong> Yi e il valore predetto in base alla retta stimata, ˆ Yi.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 22 / 32


Esempio<br />

Causalità<br />

Regressione <strong>di</strong> TestScore su STR:<br />

TestScr = 698, 933<br />

(9,468)<br />

− 2, 280 STR<br />

(0,480)<br />

T = 420 ¯ R 2 = 0, 0490 SER = 18, 581<br />

Ora inclu<strong>di</strong>amo la percentuale <strong>di</strong> studenti non <strong>di</strong> madrelingua nel<br />

<strong>di</strong>stretto ( PctEL):<br />

testscr = 686, 032<br />

(7,411)<br />

− 1, 10 STR − 0, 65 PctEL<br />

(0,380) (0,039)<br />

T = 420 ¯ R 2 = 0, 424 SER = 14, 464<br />

Che cosa accade al coefficiente <strong>di</strong> STR?<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 23 / 32<br />

(1)<br />

(2)


Misure <strong>di</strong> Goodness-of-Fit<br />

Misure <strong>di</strong> bontà dell’adattamento nella <strong>regressione</strong><br />

<strong>multipla</strong><br />

Reale = predetto + residuale: Yi = ˆ Yi + ûi<br />

SER = deviazione standard <strong>di</strong> ûi (con correzione per gra<strong>di</strong> <strong>di</strong> libertà)<br />

RMSE = deviazione standard <strong>di</strong> ûi (senza correzione per gra<strong>di</strong> <strong>di</strong> libertà)<br />

R 2 = frazione della varianza <strong>di</strong> Y spiegata da X<br />

R 2 corretto ( ¯ R 2 )= R 2 con una correzione per gra<strong>di</strong> <strong>di</strong> libertà che corregge<br />

per l’incertezza della stima; ¯ R 2 < R 2<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 24 / 32


SER e RMSE<br />

Misure <strong>di</strong> Goodness-of-Fit<br />

Come nella <strong>regressione</strong> con un unico regressore, SER e RMSE sono misure<br />

della <strong>di</strong>spersione delle Y attorno alla retta <strong>di</strong> <strong>regressione</strong>:<br />

<br />

<br />

<br />

SER = 1<br />

n<br />

ûi<br />

n − k − 1<br />

i=1<br />

<br />

<br />

<br />

RMSE = 1<br />

n<br />

ûi<br />

n<br />

i=1<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 25 / 32


R 2 e ¯ R 2<br />

Misure <strong>di</strong> Goodness-of-Fit<br />

L’R 2 è la frazione della varianza spiegata - stessa definizione della<br />

<strong>regressione</strong> con singolo regressore:<br />

dove<br />

R 2 = ESS<br />

T SS<br />

ESS =<br />

SSR =<br />

T SS =<br />

= 1 − RSS<br />

T SS<br />

n<br />

( ˆ Yi − ¯ Y ˆ )<br />

i=1<br />

n<br />

( ˆ Yi − Yi)<br />

i=1<br />

n<br />

(Yi − ¯ Y )<br />

i=1<br />

L’R 2 aumenta sempre quando si aggiunge un altro regressore (perchè?) -<br />

un problema per una misura <strong>di</strong> adattamento.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 26 / 32


R 2 e ¯ R 2<br />

Misure <strong>di</strong> Goodness-of-Fit<br />

L’ ¯ R 2 corregge questo problema penalizzando l’inserimento <strong>di</strong> un altro<br />

regressore - l’ ¯ R 2 non aumenta necessariamente quando si aggiunge un<br />

altro regressore.<br />

¯R 2 <br />

n − 1 SSR<br />

= 1 −<br />

n − k − 1 T SS<br />

Si noti che ¯ R 2 < R 2 , tuttavia se n è grande i due saranno molto vicini.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 27 / 32


Misure <strong>di</strong> Goodness-of-Fit<br />

Misure <strong>di</strong> bontà dell’adattamento<br />

testscr = 686, 032<br />

(7,411)<br />

− 1, 10 STR − 0, 65 PctEL<br />

(0,380) (0,039)<br />

T = 420 R 2 = 0, 426 ¯ R 2 = 0, 424 SER = 14, 464<br />

perchè l’R 2 e l’ ¯ R 2 sono così vicini?<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 28 / 32<br />

(3)


Misure <strong>di</strong> Goodness-of-Fit<br />

Le assunzioni degli OLS per il MRLM<br />

Yi = β0 + β1X1i + . . . + βkXki + ui i = 1, . . . , n<br />

A.1 E[ui|X1i = x1, . . . , Xki = xk] = 0.<br />

A.2 (X1i, . . . , Xki, Yi) sono i.i.d.<br />

A.3 Gli outlier sono improbabili: (X1i, . . . , Xki, Yi) hanno momenti quarti<br />

finiti, E[X1i] < ∞, . . . , E[Xki] < ∞, E[Yi] < ∞.<br />

A.4 Non vi è collinearità perfetta.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 29 / 32


Assunzione 1<br />

Assunzione 1:<br />

Misure <strong>di</strong> Goodness-of-Fit<br />

E[ui|X1i = x1, . . . , Xki = xk] = 0<br />

Ha la stessa interpretazione del caso della <strong>regressione</strong> con un singolo<br />

regressore.<br />

La non vali<strong>di</strong>tà <strong>di</strong> questa con<strong>di</strong>zione porta a <strong>di</strong>storsione da variabili<br />

omesse; nello specifico, se una variabile omessa appartiene all’equazione<br />

(cioè è in u) e<br />

1 è correlata con una X inclusa<br />

2 allora questa con<strong>di</strong>zione non vale e vi è <strong>di</strong>storsione da variabili omesse.<br />

La soluzione migliore, se possibile, è quella <strong>di</strong> includere la variabile<br />

omessa nella <strong>regressione</strong>.<br />

Una seconda soluzione, correlata alla precedente, è quella <strong>di</strong> includere una<br />

variabile che controlli per la variabile omessa (cfr. Capitolo 7).<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 30 / 32


Assunzioni 2, 3 e 4<br />

Assunzione 2:<br />

Misure <strong>di</strong> Goodness-of-Fit<br />

(X1i, . . . , Xki, Yi)<br />

sono i.i.d. È sod<strong>di</strong>sfatta automaticamente se i dati sono raccolti me<strong>di</strong>ante<br />

campionamento casuale semplice.<br />

Assunzione 3: gli outlier sono rari (momenti quarti finiti)<br />

È la stessa assunzione descritta per il caso <strong>di</strong> un regressore singolo. Come<br />

in quel caso, l’OLS può essere sensibile agli outlier, perciò occorre<br />

controllare i dati (<strong>di</strong>agrammi a nuvola!) per assicurarsi che non vi siano<br />

valori impazziti (refusi o errori <strong>di</strong> co<strong>di</strong>fica).<br />

Assunzione 4: Non vi è collinearità perfetta. La collinearità perfetta si ha<br />

quando uno dei regressori è funzione <strong>lineare</strong> esatta degli altri.<br />

Rossi Regressione <strong>lineare</strong> Econometria - 2013 31 / 32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!