20.05.2013 Views

Serie storiche

Serie storiche

Serie storiche

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Serie</strong> <strong>storiche</strong><br />

Danilo Cavapozzi<br />

danilo.cavapozzi@unipd.it<br />

In tutte le scorse esercitazioni abbiamo utilizzato dati cross-section<br />

che riguardavano campioni rappresentativi di persone o imprese 1 .<br />

• Non era possibile in nessun modo creare un ordinamento<br />

temporale tra le diverse osservazioni;<br />

• Se cambiavamo l’ordine delle osservazioni nel dataset, i<br />

risultati rimanevano identici.<br />

In questa esercitazione prenderemo in considerazione le serie<br />

<strong>storiche</strong>.<br />

• Le serie <strong>storiche</strong> permettono di studiare l’evoluzione<br />

temporale di un fenomeno, ad esempio, la disoccupazione, il<br />

PIL, il prezzo di un titolo azionario;<br />

• L’ordinamento delle osservazioni è fondamentale.<br />

I dati a cui facciamo riferimento mostrano le serie giornaliere di<br />

prezzi di titoli quotati presso la Borsa Valori di Milano e<br />

dell’indice Mibtel, che ha lo scopo di riassumere l’andamento del<br />

mercato azionario.<br />

• I dati fanno riferimento a tutto il biennio 2006-2007 (dal 2<br />

gennaio 2006 al 31 dicembre 2007);<br />

1 Questi appunti sono le tracce delle esercitazioni con il software gretl (http://gretl.sourceforge.net/gretl_italiano.html)<br />

realizzate per il corso di Econometria della Facoltà di Economia dell’Università di Brescia, A.A. 2011-2012. Alla<br />

pagina web http://www.decon.unipd.it/personale/curri/cavapozzi/eco_11.html trovate il materiale relativo alle<br />

esercitazioni di questo corso. (versione del 05/12/2011)<br />

1


• L’unità di tempo di riferimento è il giorno. Si considerano<br />

solo i giorni in cui i mercati azionari sono aperti<br />

(generalmente 5 giorni a settimana).<br />

Consideriamo la serie storica relativa al titolo espresso e<br />

calcoliamone il grafico.<br />

• Clicchiamo con il tasto destro e selezioniamo Grafico serie<br />

storica.<br />

Il grafico mostra chiaramente che la serie storica del titolo ha un<br />

trend decrescente.<br />

• Questo è incompatibile con l’ipotesi di stazionarietà alla base<br />

dei modelli che utilizzeremo. Per risolvere questo problema,<br />

calcoliamo le differenze prime della serie espresso;<br />

• Andiamo su Aggiungi e selezioniamo Differenze delle<br />

variabili selezionate. Apparirà una nuova variabile chiamata<br />

d_espresso;<br />

o La differenza prima del titolo espresso al tempo t è<br />

definita come espressot-espressot-1.<br />

• Per pura comodità, generiamo nello stesso modo la differenza<br />

prima della serie storica dell’indice mibtel (la utilizzeremo<br />

più avanti), che verrà salvata nella variabile d_mibtel.<br />

2


La serie differenziata oscilla intorno ad un valore<br />

approssimativamente costante lungo tutto il periodo di riferimento.<br />

Questo supporta l’ipotesi di stazionarietà. Nel resto della nostra<br />

analisi ci concentreremo su questa serie storica.<br />

• Il grafico di una serie storica può essere utile a livello<br />

intuitivo per capire se l’ipotesi di stazionarietà vale o meno,<br />

ma NON è un test formale dell’assunzione di stazionarietà.<br />

Il nostro obiettivo è costruire un modello che ci permetta di<br />

prevedere l’andamento futuro della serie storica d_espresso sulla<br />

base del suo passato.<br />

• Prevedere le differenze prime del titolo espresso permette di<br />

derivare i valori futuri del titolo stesso.<br />

• Supponiamo di osservare i prezzi del titolo espresso fino al<br />

tempo t. Se voglio stimare il prezzo del titolo al tempo t+1,<br />

stimare la differenza tra espressot+1 ed espressot permette di<br />

ottenere una stima di espressot+1 perché espressot è noto.<br />

∆espressot=espressot-espressot-1<br />

∆espressot+1=espressot+1-espressot<br />

espressot+1=espressot+∆espressot+1<br />

3


Calcoliamo l’autocorrelazione gloabale e l’autocorrelazione<br />

parziale di d_espresso selezionando questa variabile, cliccando<br />

con il tasto destro e scegliendo l’opzione Correlogramma.<br />

Funzione di autocorrelazione per d_ESPRESSO<br />

LAG ACF PACF Q-stat. [p-value]<br />

1 -0,0560 -0,0560 1,6401 [0,200]<br />

2 0,1251 *** 0,1223 *** 9,8353 [0,007]<br />

3 0,0003 0,0136 9,8354 [0,020]<br />

4 0,0598 0,0461 11,7185 [0,020]<br />

5 -0,0529 -0,0503 13,1962 [0,022]<br />

6 -0,0540 -0,0736 * 14,7347 [0,022]<br />

7 -0,0458 -0,0423 15,8469 [0,027]<br />

8 0,0143 0,0242 15,9558 [0,043]<br />

9 -0,0510 -0,0320 17,3359 [0,044]<br />

10 -0,0300 -0,0342 17,8163 [0,058]<br />

11 -0,0912 ** -0,0900 ** 22,2514 [0,022]<br />

12 0,0292 0,0183 22,7063 [0,030]<br />

13 -0,0416 -0,0163 23,6309 [0,035]<br />

14 -0,0904 ** -0,1002 ** 28,0166 [0,014]<br />

15 0,0043 0,0016 28,0267 [0,021]<br />

16 0,0150 0,0200 28,1474 [0,030]<br />

17 0,0223 0,0192 28,4148 [0,040]<br />

18 -0,0529 -0,0552 29,9281 [0,038]<br />

19 0,0044 -0,0205 29,9387 [0,053]<br />

20 0,0113 -0,0022 30,0084 [0,070]<br />

21 -0,0166 -0,0239 30,1583 [0,089]<br />

22 0,0281 0,0310 30,5889 [0,105]<br />

23 -0,0243 -0,0238 30,9108 [0,125]<br />

24 0,0075 -0,0227 30,9414 [0,155]<br />

25 0,0446 0,0342 32,0328 [0,157]<br />

26 0,0197 0,0327 32,2472 [0,185]<br />

27 0,0073 -0,0022 32,2767 [0,222]<br />

Guardiamo al ritardo di ordine 3 (LAG=3),<br />

La funzione di autocorrelazione globale<br />

(ACF) è pari a 0.0003. Facendo riferimento<br />

al grafico sotto per ACF, questo valore è<br />

riassunto dal "rettangolo rosso" in<br />

corrispondenza del terzo ritardo. Il<br />

"rettangolo rosso" rimane all'interno delle<br />

"bande blu" che delimitano l’intervallo<br />

±1.96/sqrt(T). L'autocorrelazione globale al<br />

terzo ritardo non è quindi statisticamente<br />

diversa da 0 al livello di significatività del<br />

5%. In altre parole, l’autocorrelazione<br />

globale tra un valore della serie (ad esempio<br />

t) ed il suo ritardo di terzo ordine (t-3) non è<br />

significativa.<br />

La funzione di autocorrelazione parziale<br />

(PACF) è pari a 0.0136. Se guardiamo al<br />

grafico sotto per PACF, vediamo che anche<br />

in questo caso il "rettangolo rosso" rimane<br />

all'interno delle "bande blu", indicando che<br />

l'autocorrelazione paraizle al terzo ritardo<br />

non è statisticamente diversa da 0 al livello<br />

di significatività del 5%. Questo risultato ci<br />

dice che, al netto dei ritardi di primo e<br />

secondo ordine, la correlazione tra un<br />

valore della serie (ad esempio t) ed il suo<br />

ritardo di terzo ordine (t-3) non è<br />

significativo.<br />

Q-stat è la statistica di Ljung-Box che<br />

saggia (in questo caso) l’ipotesi nulla che<br />

tutte le autocorrelazioni globali fino al<br />

ritardo 3 siano nulle. L’ipotesi alternativa è<br />

che almeno una di queste autocorrelazioni<br />

globali sia diversa da 0. Questa statistica si<br />

distribuisce (in questo caso) come una chiquadro<br />

con 3 gradi di libertà. Il p-value pari<br />

a 0.020 ci porta a rifiutare l’ipotesi nulla al<br />

5%.<br />

Ai ritardi di ordine 2, 11 e 15 abbiamo<br />

autocorrelazioni globali e parziali<br />

statisticamente significative perché le<br />

“barre rosse”, che indicano i valori delle<br />

autocorrelazioni, escono dalle bande blu,<br />

che delimitano l’intervallo ±1.96/sqrt(T).<br />

4


Stimiamo un modello autoregressivo che ha il valore corrente<br />

della serie storica d_espresso come variabile dipendente ed i suoi<br />

ritardi tra le esplicative.<br />

• Per decidere quanti ritardi utilizzare, prenderemo in<br />

considerazione principalmente i criteri AIC e BIC e R-quadro<br />

corretto, che combinano il numero dei ritardi nel modello con<br />

il numero di osservazioni su cui questo viene stimato;<br />

• L’utilizzo di questi criteri porta ad un compromesso tra la<br />

parsimonia del modello ed il miglioramento dell’adattamento<br />

ai dati che deriva dall’introduzione di un numero sempre<br />

maggiore di regressori.<br />

Assumiamo che il massimo numero di ritardi che vogliamo<br />

includere nel modello sia pari a 4 (scelta puramente arbitraria). Per<br />

decidere quanti ritardi utilizzare, stimiamo sullo stesso campione<br />

una serie di modelli autoregressivi di quarto, terzo, secondo e<br />

primo ordine.<br />

• Restringiamo il campione facendo iniziare la serie storica<br />

coinvolta nella stima 5 periodi di tempo dopo;<br />

• Se non facessi questa operazione, stimerei i modelli su un<br />

numero di osservazioni che diminuisce all’aumentare dei<br />

ritardi inseriti. Ad esempio, il quarto ritardo della differenza<br />

prima sarà pari alla differenza espressot-4-espressot-5. Questa<br />

variabile è definita solo per le osservazioni che hanno almeno<br />

5 osservazioni precedenti;<br />

• Andiamo su Campione/Imposta intervallo e dichiariamo che<br />

l’inizio del periodo di riferimento deve avvenire 5 periodi più<br />

avanti (il 2006/01/09);<br />

• Vedremo che in fondo alla finestra di gretl verrà mostrato che<br />

il campione attuale è ristretto.<br />

Stimiamo un modello autoregressivo di ordine 4 per la serie<br />

storica d_espresso. Andiamo su Modello/OLS e dichiariamo che la<br />

variabile dipendente è d_espresso. Per inserire i ritardi clicchiamo<br />

5


su Ritardi e dichiariamo che vogliamo inserire tutti i ritardi di<br />

d_espresso dal primo al quarto.<br />

• Bisogna assicurarsi che la matrice di varianze e covarianze<br />

dello stimatore sia stimata con il metodo HAC, che tiene<br />

conto dell’autocorrelazione del termine di errore nel modello.<br />

• A meno di non assumere che i 4 ritardi siano sufficienti per<br />

spiegare interamente la determinazione del valore di<br />

d_espresso, è opportuno ammettere che l’errore del modello<br />

di regressione sia autocorrelato.<br />

AR(4)<br />

Modello 12: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00248696 0,00155298 -1,601 0,1099<br />

d_ESPRESSO_1 -0,0527765 0,0434477 -1,215 0,2250<br />

d_ESPRESSO_2 0,124819 0,0431152 2,895 0,0040 ***<br />

d_ESPRESSO_3 0,0154085 0,0427663 0,3603 0,7188<br />

d_ESPRESSO_4 0,0452496 0,0372630 1,214 0,2252<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,677226 E.S. della regressione 0,036405<br />

R-quadro 0,022545 R-quadro corretto 0,014894<br />

F(4, 511) 2,741177 P-value(F) 0,028066<br />

Log-verosimiglianza 979,8789 Criterio di Akaike -1949,758<br />

Criterio di Schwarz -1928,527 Hannan-Quinn -1941,438<br />

rho 0,002254 Valore h di Durbin 0,306579<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Ora vediamo come varia l’adattamento ai dati togliendo un ritardo<br />

alla volta e stimando così modelli autoregressivi di ordine<br />

inferiore.<br />

AR(3)<br />

Modello 13: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00260149 0,00156446 -1,663 0,0970 *<br />

d_ESPRESSO_1 -0,0521179 0,0433356 -1,203 0,2297<br />

d_ESPRESSO_2 0,130452 0,0442643 2,947 0,0034 ***<br />

d_ESPRESSO_3 0,0130882 0,0433268 0,3021 0,7627<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

6


Somma quadr. residui 0,678640 E.S. della regressione 0,036407<br />

R-quadro 0,020505 R-quadro corretto 0,014766<br />

F(3, 512) 3,102859 P-value(F) 0,026337<br />

Log-verosimiglianza 979,3409 Criterio di Akaike -1950,682<br />

Criterio di Schwarz -1933,697 Hannan-Quinn -1944,026<br />

rho -0,000743 Valore h di Durbin -0,093047<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

AR(2)<br />

Modello 14: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00263443 0,00158346 -1,664 0,0968 *<br />

d_ESPRESSO_1 -0,0504727 0,0441905 -1,142 0,2539<br />

d_ESPRESSO_2 0,129834 0,0441840 2,938 0,0034 ***<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,678758 E.S. della regressione 0,036375<br />

R-quadro 0,020334 R-quadro corretto 0,016515<br />

F(2, 513) 4,534551 P-value(F) 0,011165<br />

Log-verosimiglianza 979,2959 Criterio di Akaike -1952,592<br />

Criterio di Schwarz -1939,854 Hannan-Quinn -1947,600<br />

rho -0,001787 Durbin-Watson 2,000236<br />

AR(1)<br />

Modello 16: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

----------------------------------------------------------------<br />

const -0,00303673 0,00176032 -1,725 0,0851 *<br />

d_ESPRESSO_1 -0,0586608 0,0503737 -1,165 0,2448<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,690463 E.S. della regressione 0,036651<br />

R-quadro 0,003440 R-quadro corretto 0,001501<br />

F(1, 514) 1,356090 P-value(F) 0,244757<br />

Log-verosimiglianza 974,8846 Criterio di Akaike -1945,769<br />

Criterio di Schwarz -1937,277 Hannan-Quinn -1942,441<br />

rho 0,008143 Durbin-Watson 1,980360<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Il modello autoregressivo di secondo ordine minimizza i criteri<br />

AIC, BIC e massimizza il criterio R-quadro corretto 2 . Questo<br />

modello realizza il miglior compromesso tra adattamento ai dati e<br />

parsimonia della specificazione 3 .<br />

2 Non sempre si arriva ad una situazione in cui una specificazione minimizza AIC e BIC e massimizza R-quadro<br />

corretto. Ad esempio, se si fosse dovuto scegliere tra i soli modelli AR(3) e AR(4), si poteva optare per AR(3) alla luce<br />

del fatto che questa specificazione minimizzava i criteri AIC e BIC ed il ritardo di ordine 4 non era significativo.<br />

3 Se avessimo per esempio guardato ad R-quadro, che non premia la parsimonia del modello, avremmo dovuto scegliere<br />

il modello autoregressivo di quarto ordine.<br />

7


Supponiamo ora che voglia utilizzare il modello AR(2) stimato<br />

per prevedere l’andamento della serie storica d_espresso nei 5<br />

periodi di tempo successivi alla fine della finestra temporale per<br />

cui osservo la serie storica.<br />

• Andiamo su Analisi/Previsione e dichiariamo che vogliamo<br />

inserire 5 nuove osservazioni.<br />

• Selezioniamo la modalità previsione automatica e<br />

dichiariamo che vogliamo disegnare l’intervallo di<br />

confidenza attraverso le Linee di confidenza.<br />

o Ricordate che l’intervallo di confidenza si basa<br />

sull’assunzione di normalità dell’errore (che poi<br />

verificheremo). Se questa assunzione non è supportata,<br />

l’intervallo di confidenza non è valido.<br />

Il grafico mostra in rosso i valori osservati, in blu quelli predetti<br />

ed in verde gli estremi degli intervalli di confidenza al 95% delle<br />

previsioni.<br />

• Il confronto tra valori osservati e predetti per il periodo su cui<br />

abbiamo stimato la serie storica è una misura<br />

dell’adattamento del modello ai dati;<br />

• Entrambe le serie <strong>storiche</strong> oscillano intorno<br />

(approssimativamente) allo 0 grazie all’inclusione della<br />

costante nella specificazione. Tuttavia, i picchi positivi e<br />

8


negativi dei valori osservati non sono replicati dai valori<br />

predetti, come potevamo aspettarci visto il basso R-quadro<br />

ottenuto.<br />

Andiamo ora a verificare se l’errore del modello si distribuisce<br />

effettivamente secondo una normale.<br />

• Salvo i residui del modello nella variabile resid.<br />

• Il grafico dei residui mostra che la loro distribuzione<br />

campionaria è concentrata intorno allo 0. Tuttavia, il test di<br />

normalità riportato (di Doornik-Hansen, che combina gli<br />

indici di asimmetria e curtosi) porta a rifiutare l’ipotesi nulla<br />

che i residui si distribuiscono secondo una normale;<br />

• Questo risultato mostra che gli intervalli di confidenza della<br />

previsione che abbiamo visto prima non sono corretti perché<br />

si basavano sull’assunzione di normalità degli errori del<br />

modello, di cui i residui sono stime;<br />

• L’inferenza sui parametri del modello può invece essere<br />

sviluppata utilizzando tutti i risultati asintotici visti nel corso.<br />

Il correlogramma dei residui mostra autocorrelazioni globali e<br />

parziali significative ai ritardi 6 e 14.<br />

• Questo risultato ci porta a pensare che gli errori del modello<br />

siano autocorrelati e supporta la scelta di utilizzare lo<br />

9


stimatore HAC per la matrice di varianze e covarianze dello<br />

stimatore dei parametri sulle esplicative del modello.<br />

Ora andiamo a verificare formalmente se la serie storica<br />

d_espresso possa essere ritenuta stazionaria o meno. L’ipotesi di<br />

stazionarietà è alla base dei modelli autoregressivi che abbiamo<br />

utilizzato.<br />

Una prima fonte di non stazionarietà può derivare dalla presenza<br />

di radici unitarie. Effettuiamo il test Augmented Dickey-Fuller.<br />

• Questo test consiste nel regredire la differenza prima della<br />

serie (nel nostro caso la differenza prima di d_espresso) su<br />

costante, valore ritardato della serie storica (nel nostro caso il<br />

ritardo di d_espresso) ed una serie di ritardi delle differenze<br />

prima della serie (nel nostro caso i ritardi delle differenze<br />

prime di d_espresso);<br />

o In alternativa, si può aggiungere a questo set di<br />

esplicative anche un trend temporale.<br />

• La statistica test da considerare è la statistica t sul parametro<br />

del valore ritardato della serie. In questo caso però la<br />

statistica t non ha distribuzione normale ed i valori critici<br />

devono essere calcolati ad hoc;<br />

• Selezioniamo la variabile d_espresso, andiamo su<br />

Variabile/Test per radice unitaria/Test Dickey-Fuller<br />

10


aumentato. Effettuiamo il test alternativamente sia con la sola<br />

costante che con costante e trend.<br />

• L’ipotesi nulla di questo test è che la serie storica d_espresso<br />

abbia radici unitarie. L’ipotesi alternativa è l’assenza di radici<br />

unitarie.<br />

Augmented Dickey-Fuller test for d_ESPRESSO<br />

inclusi 13 ritardi di (1-L)d_ESPRESSO (max was 18)<br />

Ampiezza campionaria 506<br />

Ipotesi nulla di radice unitaria: a = 1<br />

Test con costante<br />

Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: 0,000<br />

differenze ritardate: F(13, 491) = 1,935 [0,0245]<br />

Valore stimato di (a - 1): -1,25476<br />

Statistica test: tau_c(1) = -7,52925<br />

p-value asintotico 1,136e-011<br />

Con costante e trend<br />

Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />

differenze ritardate: F(13, 490) = 1,945 [0,0235]<br />

Valore stimato di (a - 1): -1,27472<br />

Statistica test: tau_ct(1) = -7,61222<br />

p-value asintotico 3,495e-011<br />

Il p-value ci porta a rifiutare l’ipotesi nulla di presenza di radici<br />

unitarie in entrambi i casi.<br />

• Questi risultati sono in linea con il grafico della serie storica<br />

d_espresso visto prima, dove non erano visibili trend.<br />

Proviamo a rifare lo stesso test, ma guardando direttamente alla<br />

variabile espresso.<br />

• Vogliamo condurre un test formale per verificare la presenza<br />

di radici unitarie in questa serie storica;<br />

• Sulla base del grafico della serie ci aspettavamo la presenza<br />

di un trend negativo.<br />

Augmented Dickey-Fuller test for ESPRESSO<br />

inclusi 14 ritardi di (1-L)ESPRESSO (max was 18)<br />

Ampiezza campionaria 506<br />

11


Ipotesi nulla di radice unitaria: a = 1<br />

Test con costante<br />

Modello: (1-L)y = b0 + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: -0,000<br />

differenze ritardate: F(14, 490) = 2,072 [0,0121]<br />

Valore stimato di (a - 1): 0,00246612<br />

Statistica test: tau_c(1) = 0,456229<br />

p-value asintotico 0,9852<br />

Con costante e trend<br />

Modello: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e<br />

Coefficiente di autocorrelazione del prim'ordine per e: 0,001<br />

differenze ritardate: F(14, 489) = 1,951 [0,0198]<br />

Valore stimato di (a - 1): -0,0153155<br />

Statistica test: tau_ct(1) = -1,29083<br />

p-value asintotico 0,8899<br />

In questo caso invece accetto l’ipotesi nulla di presenza di radici<br />

unitarie. Se avessi stimato i modelli autoregressivi direttamente<br />

sui livelli di espresso, avrei ottenuto risultati non validi in quanto<br />

questi modelli ipotizzano la stazionarietà della serie.<br />

Un ulteriore motivo che può compromettere la stazionarietà della<br />

serie è la presenza di break strutturali dovuti per esempio a crisi<br />

finanziarie o cambi nelle politiche di gestione dell’azienda.<br />

• Questi cambiamenti possono modificare da un certo<br />

momento in avanti la costante o i coefficienti sui ritardi del<br />

modello autoregressivo stimato, rendendoli non invarianti nel<br />

tempo.<br />

Ipotizziamo di volere verificare la presenza di un break strutturale<br />

con punto di rottura (break point) 1 gennaio 2007. Vogliamo<br />

vedere se ci sono differenze nei parametri relativi nel nostro<br />

modello tra il periodo antecedente al 1 gennaio 2007 e quello<br />

successivo.<br />

• Andiamo su Test/Chow BREAK strutturale ed inseriamo la<br />

data del punto di rottura.<br />

12


Il test prevede la stima di un ulteriore modello che alle variabili<br />

esplicative già incluse aggiunge<br />

• una dummy che vale 1 per tutte le osservazioni successive al<br />

1 gennaio 2007 (compreso) e 0 per quelle precedenti;<br />

• le interazioni tra questa variabile dummy ed i ritardi di<br />

d_espresso.<br />

L’ipotesi nulla del test di stabilità strutturale pone congiuntamente<br />

pari a 0 tutti i parametri delle nuove esplicative aggiunte. Se i<br />

parametri relativi alle nuove variabili inserite non sono<br />

statisticamente significativi, allora non c’è break strutturale ed il<br />

nostro modello iniziale è appropriato per studiare l’andamento<br />

della serie storica in entrambi i periodi.<br />

• In altre parole, secondo l’ipotesi nulla costante e parametri<br />

sui ritardi non variano tra il periodo precedente all’1 gennaio<br />

2007 e quello successivo.<br />

• L’ipotesi alternativa invece assume che almeno uno di questi<br />

parametri sia diverso da 0. Se è così, i dati supportano<br />

l’ipotesi che l’1 gennaio 2007 si sia verificato un break<br />

strutturale che ha cambiato la costante o almeno uno dei<br />

parametri sui ritardi.<br />

La statistica test si distribuisce asintoticamente secondo una chiquadro<br />

con gradi di libertà pari al numero di variabili aggiunte nel<br />

modello (nel nostro caso 3).<br />

Regressione aumentata per il test Chow<br />

OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

---------------------------------------------------------------<br />

const -0,00181416 0,00214406 -0,8461 0,3979<br />

d_ESPRESSO_1 -0,0342325 0,0636705 -0,5377 0,5911<br />

d_ESPRESSO_2 0,0577450 0,0562140 1,027 0,3048<br />

splitdum -0,00154595 0,00314311 -0,4919 0,6230<br />

sd_d_ESPRESSO_1 -0,0291007 0,0869532 -0,3347 0,7380<br />

sd_d_ESPRESSO_2 0,130498 0,0852982 1,530 0,1267<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

13


Somma quadr. residui 0,675162 E.S. della regressione 0,036385<br />

R-quadro 0,025523 R-quadro corretto 0,015970<br />

F(5, 510) 2,315247 P-value(F) 0,042645<br />

Log-verosimiglianza 980,6662 Criterio di Akaike -1949,332<br />

Criterio di Schwarz -1923,856 Hannan-Quinn -1939,349<br />

rho 0,002454 Durbin-Watson 1,991644<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Test Chow per break strutturale all'osservazione 2007/01/01<br />

Chi-quadro(3) = 2,55447 con p-value 0,4655<br />

Il p-value relativo alla distribuzione chi-quadro porta ad accettare<br />

l’ipotesi nulla che non ci sia un break strutturale avvenuto l’1<br />

gennaio.<br />

• Questo non esclude che non si possano essere verificati altri<br />

punti di rottura in altri istanti di tempo.<br />

Ora vogliamo valutare se l’andamento del mercato finanziario<br />

possa essere una informazione rilevante per predire l’andamento<br />

della serie storica d_espresso.<br />

L’andamento del mercato finanziario può essere riassunto dalla<br />

serie storica dell’indice Mibtel, che raccoglie un vasto numero di<br />

titoli sufficientemente diversificati;<br />

• L’indice Mibtel può essere interpretato come un portafoglio<br />

di mercato;<br />

• Inserire la serie storica mibtel tra le esplicative del modello<br />

ne aumenta la capacità predittiva?<br />

La serie storica di mibtel non pare essere in linea con l’assunzione<br />

di stazionarietà.<br />

14


Inserisco nel modello le differenze prime di questa serie, che sono<br />

state salvate precedentemente in d_mibtel. In aggiunta, inserisco<br />

nel modello anche tutti i ritardi fino al secondo ordine delle<br />

differenze prime.<br />

Modello 5: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: d_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

--------------------------------------------------------------<br />

const -0,00317269 0,00139184 -2,279 0,0231 **<br />

d_MIBTEL 7,38282e-05 5,99204e-06 12,32 1,02e-030 ***<br />

d_MIBTEL_1 1,43554e-05 5,92576e-06 2,423 0,0158 **<br />

d_MIBTEL_2 1,88210e-06 5,89925e-06 0,3190 0,7498<br />

d_ESPRESSO_1 -0,0758190 0,0474423 -1,598 0,1106<br />

d_ESPRESSO_2 0,0992680 0,0376798 2,635 0,0087 ***<br />

Media var. dipendente -0,002859 SQM var. dipendente 0,036679<br />

Somma quadr. residui 0,499736 E.S. della regressione 0,031303<br />

R-quadro 0,278720 R-quadro corretto 0,271648<br />

F(5, 510) 40,70387 P-value(F) 3,09e-35<br />

Log-verosimiglianza 1058,291 Criterio di Akaike -2104,583<br />

Criterio di Schwarz -2079,106 Hannan-Quinn -2094,599<br />

rho -0,002187 Durbin-Watson 2,001839<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Per verificare se nel complesso l’informazione riguardante il<br />

portafoglio di mercato contribuisce ad aumentare la capacità<br />

predittiva del modello devo condurre il test di causalità di<br />

Granger.<br />

Questo test consiste nel verificare la significatività congiunta delle<br />

differenze prime di mibtel e di tutti i loro ritardi.<br />

15


• L’ipotesi nulla è che i parametri relativi a d_MIBTEL,<br />

d_MIBTEL_1 e d_MIBTEL_2 siano congiuntamente pari a 0.<br />

L’ipotesi alternativa è che almeno uno di questi parametri<br />

non sia pari a 0.<br />

La statistica test ha come sempre una distribuzione chi-quadro con<br />

gradi di libertà pari al numero di variabili di cui stiamo testando la<br />

significatività congiunta.<br />

• Se questo test viene effettuato con il comando Test/Omit,<br />

bisogna selezionare l’opzione Test di Wald perché vogliamo<br />

sfruttare la stima della matrice di varianze e covarianze<br />

ottenuta con lo stimatore HAC.<br />

Ipotesi nulla: i parametri della regressione valgono zero per le<br />

variabili<br />

d_MIBTEL, d_MIBTEL_1, d_MIBTEL_2<br />

Statistica test asintotica:<br />

Chi-quadro di Wald(3) = 159,726, con p-value = 2,1002e-034<br />

L’ipotesi nulla è rifiutata. In particolare, possiamo vedere che<br />

questo risultato è guidato principalmente dalla significatività dei<br />

parametri relativi a d_MIBTEL e d_MIBTEL_1.<br />

• L’informazione relativa alle differenze prime dell’indice<br />

Mibtel ed ai loro ritardi aumenta significativamente la<br />

capacità predittiva del modello.<br />

• Le variabili che abbiamo aggiunto sono significativamente<br />

correlate con il valore corrente di d_espresso, anche se ci<br />

condizioniamo ai suoi ritardi di ordine 1 e 2.<br />

• Questo risultato è statisticamente valido ma nulla ci dice<br />

circa la relazione tra rendimenti del titolo espresso e<br />

rendimenti del mercato.<br />

Il modello teorico che permette di capire come i rendimenti di un<br />

titolo rischioso variano con quelli del mercato si chiama Capital<br />

Asset Pricing Model (CAPM).<br />

16


Definiamo i rendimenti giornalieri rt di un titolo a partire dal suo<br />

prezzo giornaliero pt utilizzando la formula<br />

Δ ln(<br />

⎛<br />

⎜<br />

⎝<br />

p<br />

⎞<br />

⎟<br />

⎠<br />

t<br />

t<br />

t t−1<br />

t t−1<br />

p t ) = ln( pt<br />

) − ln( pt<br />

−1)<br />

= ln<br />

⎜<br />

=<br />

=<br />

≅ =<br />

p ⎟<br />

ln<br />

⎜<br />

−1<br />

+ 1<br />

t p ⎟<br />

ln<br />

⎜<br />

+ 1<br />

t<br />

p ⎟<br />

−1<br />

−1<br />

t−1<br />

pt<br />

−1<br />

Il CAPM definisce la seguente equazione fondamentale<br />

⎛<br />

⎜<br />

⎝<br />

( r r ) ( r r )<br />

p<br />

− = α + β − + η<br />

i F M F i<br />

t i i t t<br />

• r F è il rendimento giornaliero dei titoli non rischiosi, che può<br />

essere ragionevolmente posto pari a 0;<br />

• αi misura la differenza nel rendimento medio del titolo i al<br />

tempo t rispetto al rendimento del mercato;<br />

o Un valore positivo (negativo) di αi indica un eccesso<br />

(difetto) di rendimento medio del titolo rispetto al<br />

rendimento del mercato.<br />

• βi misura la sensibilità del titolo i rispetto ai movimenti del<br />

mercato.<br />

o Un βi inferiore a 1 indica che il titolo i è difensivo (cioè<br />

attenua i movimenti del mercato);<br />

o Un βi superiore a 1 indica che il titolo i è aggressivo<br />

(cioè amplifica i movimenti del mercato);<br />

o Un βi pari a 1 indica invece una variabilità dei<br />

rendimenti in linea con quella del mercato.<br />

Per stimare l’equazione del CAPM per il titolo espresso dobbiamo<br />

prima di tutto definire i rendimenti di questo titolo e quelli del<br />

portafoglio di mercato, che come prima descriviamo attraverso la<br />

serie mibtel.<br />

• Selezioniamo espresso ed andiamo su Aggiungi/Differenze<br />

logaritmiche delle variabili selezionate. Facciamo lo stesso<br />

con mibtel.<br />

⎞<br />

⎟<br />

⎠<br />

⎛ p<br />

⎜<br />

⎝<br />

− p<br />

⎞<br />

⎟<br />

⎠<br />

p<br />

− p<br />

r<br />

t<br />

17


• Le due nuove variabili si chiameranno rispettivamente<br />

ld_espresso e ld_mibtel.<br />

Stimiamo l’equazione del CAPM selezionando Modello/OLS<br />

specificando un modello avente come variabile dipendente<br />

ld_espresso e come variabili esplicative la costante e ld_mibtel.<br />

Modello 2: OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: ld_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

---------------------------------------------------------------<br />

const -0,000849581 0,000363464 -2,337 0,0198 **<br />

ld_MIBTEL 0,576885 0,0464181 12,43 3,43e-031 ***<br />

Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />

Somma quadr. residui 0,033947 E.S. della regressione 0,008127<br />

R-quadro 0,262012 R-quadro corretto 0,260576<br />

F(1, 514) 154,4557 P-value(F) 3,43e-31<br />

Log-verosimiglianza 1752,123 Criterio di Akaike -3500,246<br />

Criterio di Schwarz -3491,754 Hannan-Quinn -3496,918<br />

rho -0,085180 Durbin-Watson 2,165052<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

La stima della costante è una stima del parametro α del CAPM.<br />

• Verifico il sistema di ipotesi H0: α=0, H1: α


• In particolare, il rendimento medio del titolo espresso è<br />

inferiore a quello di mercato di 0.08(=100*(0.000849581))<br />

punti percentuali.<br />

La stima del parametro relativo a ld_mibtel è una stima del<br />

coefficiente βld_mibtel dell'equazione fondamentale del CAPM.<br />

• La stima puntuale di βld_mibtel è inferiore a 1;<br />

• Verifico il sistema di ipotesi H0: βld_mibtel=1, H1: βld_mibtel


Per verificare questa ipotesi devo effettuare nuovamente un test di<br />

stabilità strutturale.<br />

• L’ipotesi nulla prevede che costante e parametro relativo a<br />

ld_mibtel non varino tra il periodo antecedente al 30 marzo<br />

2007 ed il periodo successivo;<br />

• L’ipotesi alternativa prevede invece che almeno uno dei due<br />

parametri vari.<br />

Analogamente a prima, vengono inserite nel modello<br />

• una dummy che vale 1 per tutte le osservazioni successive al<br />

30 marzo 2007 (compreso) e 0 per quelle precdenti;<br />

• l’interazione tra questa variabile dummy e ld_mibtel.<br />

• Se queste due variabili sono congiuntamente non<br />

significative, l’ipotesi nulla è accettata.<br />

Nel nostro caso la statistica test si distribuisce asintoticamente<br />

secondo una chi-quadro con due gradi di libertà.<br />

Regressione aumentata per il test Chow<br />

OLS, usando le osservazioni 2006/01/09-2007/12/31 (T = 516)<br />

Variabile dipendente: ld_ESPRESSO<br />

Errori standard HAC, larghezza di banda 6 (Kernel di Bartlett)<br />

coefficiente errore std. rapporto t p-value<br />

--------------------------------------------------------------<br />

const -0,000732545 0,000397308 -1,844 0,0658 *<br />

ld_MIBTEL 0,608675 0,0620387 9,811 6,16e-021 ***<br />

splitdum -0,000350749 0,000808660 -0,4337 0,6647<br />

sd_ld_MIBTEL -0,0719411 0,0915287 -0,7860 0,4322<br />

Media var. dipendente -0,000763 SQM var. dipendente 0,009451<br />

Somma quadr. residui 0,033886 E.S. della regressione 0,008135<br />

R-quadro 0,263344 R-quadro corretto 0,259028<br />

F(3, 512) 53,54939 P-value(F) 4,06e-30<br />

Log-verosimiglianza 1752,589 Criterio di Akaike -3497,178<br />

Criterio di Schwarz -3480,194 Hannan-Quinn -3490,523<br />

rho -0,084555 Durbin-Watson 2,163364<br />

Note: SQM = scarto quadratico medio; E.S. = errore standard<br />

Test Chow per break strutturale all'osservazione 2007/03/30<br />

Chi-quadro(2) = 0,949279 con p-value 0,6221<br />

Il p-value mi porta ad accettare l’ipotesi nulla di stabilità<br />

strutturale.<br />

20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!