19.06.2013 Views

2.Statistica induttiva

2.Statistica induttiva

2.Statistica induttiva

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2. Statistica <strong>induttiva</strong><br />

Abbiamo visto come per mezzo della statistica descrittiva sia possibile ottenere una<br />

descrizione sintetica di dati sperimentali riguardanti un determinato processo; questa è finalizzata<br />

alla rappresentazione dell’informazione utile agli scopi fissati per la definizione di opportune<br />

strategie di intervento. Tuttavia, riprendendo l’esempio trattato, abbiamo visto come i parametri<br />

descrittivi venivano dedotti dalla distribuzione campionaria o empirica, ovvero il loro valore era<br />

legato strettamente ai valori dei dati ottenuti nel particolare esperimento eseguito; ripetendo<br />

l’esperimento, cioè prelevando un altro campione di N 100 supporti di ferro, determinando sul<br />

, non necessariamente rispetto agli stessi<br />

nuovo campione di dati la distribuzione campionaria i<br />

sottoinsiemi E i<br />

, ricalcolando i parametri statistici<br />

, , d, c,<br />

otterremmo dei valori diversi da<br />

quelli relativi al primo insieme di dati! Questa variabilità dipende in primo luogo dalla numerosità<br />

del campione analizzato e poi dalla sua significatività, ovvero da quanto debba ritenersi<br />

rappresentativo di tutta la produzione. E’ facile comprendere come un campione molto numeroso<br />

consenta di definire un istogramma più preciso della distribuzione effettiva e quindi un calcolo più<br />

attendibile delle varie medie; tuttavia se la nostra fabbrica di supporti in ferro si servisse da due<br />

diversi fornitori di materie prime, ed il nostro campione di dati, ancorché numeroso, avesse<br />

riguardato le unità prodotte con materie prime prese solo da uno dei due fornitori, avremmo<br />

ottenuto una parziale descrizione delle caratteristiche del processo di produzione, non considerando<br />

le caratteristiche dei prodotti ottenuti con lo stesso processo ma con materie prime di altra<br />

provenienza.<br />

La statistica <strong>induttiva</strong> si propone di fornire procedure sistematiche per la verifica della<br />

significatività di un campione di dati in termini sia di scelta della numerosità che di<br />

rappresentatività dell’intera popolazione! Possiamo grosso modo distinguere i seguenti argomenti<br />

Stima puntuale: consiste nel determinare dai dati il valore di un parametro e nel valutare<br />

l’attendibilità della stima<br />

Stima di intervallo: si vuole determinare un intervallo di valori entro il quale possa cadere<br />

con buona probabilità il valore di un parametro incognito<br />

Criteri di verifica delle ipotesi: scelta sistematica tra possibili valori di un parametro quello<br />

più verosimile sulla base dell’evidenza sperimentale<br />

Analisi della varianza: per verificare ipotesi complesse<br />

Programmazione degli esperimenti: tecniche di campionamento e di scelta della<br />

numerosità del campione.<br />

Stima puntuale del valore medio e della varianza<br />

Consideriamo un insieme di N unità e sia X una v.a. che rappresenta i valori di una<br />

determinata qualità degli elementi dell’insieme (il carico di rottura dei supporti in ferro, il<br />

coefficiente del transistor, il rendimento annuo di un prodotto finanziario, la percentuale di<br />

sostanze inquinanti in un campione di acqua, ecc.), che quindi assume i valori x i N<br />

. Come è noto il valor medio e la varianza di X sono definiti nel seguente modo<br />

2<br />

i<br />

27<br />

, 1, , , su


28<br />

2<br />

1 N<br />

2 1 N<br />

xi, xi<br />

<br />

N i1 N i1<br />

ma, non potendo analizzare tutto l’insieme , risultano di valore incognito.<br />

Estraiamo ora dall’insieme un campione casuale di nN elementi e valutiamo la media<br />

campionaria su questo sottoinsieme di dati<br />

ˆ <br />

n<br />

1<br />

n x j<br />

n j1<br />

Ci chiediamo, quanto il valore ˆ n sia vicino o meno al valore medio di popolazione ; in altre<br />

parole possiamo dire che ˆ n è una buona stima di ? Quali caratteristiche di ˆ n dovremmo<br />

osservare per validare o meno questa affermazione?<br />

Come al solito dovremo considerare le cose da un punto di vista statistico. Infatti la<br />

grandezza ˆ n è di natura aleatoria in quanto scegliendo a caso da un qualunque altro campione<br />

di dimensione n , otterremmo un valore ˆ n differente dal precedente, e così via per ogni scelta del<br />

campione. La stima sarà buona se la distribuzione dei valori di ˆ n si localizza sul valore vero e<br />

se i valori sono tutti addensati intorno a . In altre parole stiamo richiedendo che<br />

2<br />

ˆ , ˆ <br />

2<br />

E n ˆ E <br />

n<br />

n <br />

piccola<br />

<br />

cioè che la media E ˆ n della stima di valor medio coincida con il valore vero , e che la<br />

varianza della stima sia piccola. Calcoliamo quindi queste grandezze<br />

1 n 1 n 1<br />

E ˆ nE xj Exj n<br />

<br />

n j1 n<br />

<br />

<br />

<br />

<br />

<br />

<br />

j1<br />

n<br />

dove nel penultimo passaggio si è considerato che il generico valore x j deriva da una popolazione<br />

con valore medio . Il primo requisito è rispettato; in questi casi si dice che la stima non è distorta,<br />

vale a dire che mediamente non si commettono errori nel determinare il valore della grandezza<br />

incognita . Se questo non fosse stato il caso, i.e. E ˆ n , avrebbe significato che il nostro<br />

metodo di stima sarebbe stato affetto da un errore sistematico (uno strumento starato).<br />

Il calcolo della varianza è un po’ più elaborato perché dipende da come è estratto il<br />

campione; se gli elementi del campione sono scelti in maniera indipendente uno dall’altro si ha<br />

2<br />

2 1n <br />

n j <br />

j1<br />

ˆ <br />

2<br />

ˆ E E<br />

x <br />

n <br />

n


2 2<br />

2 1 n 1 n 1 n n<br />

<br />

ˆ E x ( )<br />

2 2 <br />

n j E xj E<br />

xi xj<br />

<br />

nj1 n j1 <br />

<br />

n i1 j1<br />

<br />

<br />

<br />

<br />

2<br />

1 n 2 n n<br />

1 2 <br />

<br />

2 Exj <br />

Exi xj n<br />

2<br />

n j1 <br />

i1 j1 <br />

n n<br />

ji <br />

dove, per l’indipendenza degli elementi, si ha che la covarianza<br />

0<br />

E x x E x E x <br />

<br />

<br />

i j i j<br />

ij Se invece gli elementi del campione non sono indipendenti si ha<br />

2 2<br />

2 1 n 1 n 1 n n<br />

<br />

ˆ E x ( )<br />

2 2 <br />

n j E xj E<br />

xi xj<br />

<br />

nj1 n j1 <br />

<br />

n i1 j1<br />

<br />

<br />

<br />

2<br />

1 n 2 n n<br />

2 n <br />

2 Exj <br />

Exi xj 2<br />

n j1 <br />

i1 j1 <br />

n<br />

<br />

n 2<br />

<br />

<br />

ji <br />

Ora se scegliessimo n N avremmo ˆ n con varianza nulla, per cui<br />

da cui<br />

2 2 2<br />

2 N N 1<br />

<br />

0 <br />

2<br />

N N<br />

<br />

2<br />

<br />

N N N 1<br />

<br />

2<br />

ˆ n<br />

2 2 2<br />

n1 n1<br />

1 <br />

n n N 1 N 1<br />

n<br />

<br />

In entrambi i casi si vede come aumentando n si ottenga una diminuzione di<br />

29<br />

2<br />

ˆn e quindi un<br />

aumento della precisione della stima!<br />

Tuttavia, se dal problema ci fosse richiesto di determinare il minimo valore di n per<br />

assicurare che la precisione della stima non scenda sotto un minimo assegnato, per cui la varianza


30<br />

della stima 2 ˆ non deve superare un limite assegnato, ci troveremmo nella necessità di dover<br />

n<br />

2<br />

della popolazione. Analogamente a quanto è stato fatto per il valor<br />

stimare anche la varianza<br />

medio, potremmo pensare di stimare la varianza campionaria con la seguente espressione<br />

1<br />

s x<br />

n<br />

2<br />

ˆ <br />

2<br />

n<br />

n j n<br />

j1<br />

ma in questo caso si può vedere subito che tale stima sarebbe distorta, cioè presenterebbe un errore<br />

sistematico; infatti, nel caso in cui gli elementi del campione siano scelti in modo indipendente, si<br />

ottiene<br />

2 1 n 2 1 n 2 1 n<br />

2<br />

Es [ n] E <br />

xj ˆ n Exj ˆ n E (<br />

xj<br />

) ( ˆ n )<br />

<br />

n j1 <br />

<br />

n j1 n <br />

<br />

<br />

j1<br />

<br />

1 2 2<br />

<br />

E xj ˆ n 2xj ˆ n <br />

n<br />

n n n<br />

<br />

<br />

<br />

<br />

j1 j1 j1<br />

<br />

1 2 1 1<br />

n n n n n <br />

n<br />

n <br />

<br />

n <br />

n n n<br />

2<br />

2 2 2 2 2 n 2 2<br />

ˆ <br />

2<br />

mentre nel caso che gli elementi non siano scelti in modo indipendente, omettendo i calcoli, si<br />

ottiene<br />

Es [ ]<br />

n1N n N 1<br />

2 2 2<br />

n <br />

Ma la situazione non è così drammatica, infatti basta modificare l’espressione della stima in<br />

modo opportuno per togliere l’errore sistematico. Nel caso di campione indipendente si scelga come<br />

stima campionaria della varianza la seguente espressione<br />

mentre nel secondo caso si scelga<br />

2<br />

n 1<br />

ˆ s x ˆ E ˆ <br />

n1 n1<br />

n<br />

2 2 2 2<br />

n,1 n j n , <br />

<br />

n,1<br />

j1<br />

2<br />

n N 1 N 1 1<br />

<br />

ˆ ˆ ˆ <br />

n1 N N n1 <br />

n<br />

2 2 2 2<br />

n,2 sn xj n , E<br />

<br />

n,2<br />

j1


In entrambi i casi siamo in grado di ottenere quindi una stima centrata della varianza.<br />

Analizziamo ora la varianza della stima. Per il caso di campione indipendente si ha (omettiamo la<br />

dimostrazione)<br />

<br />

4<br />

4 <br />

2 E 2 2 2 X <br />

n 3<br />

2 E ˆ ˆn,1 E[ ˆn,1]<br />

<br />

<br />

<br />

4<br />

n,1<br />

<br />

n n1<br />

<br />

4 4<br />

Ora sappiamo che un valore di riferimento per il rapporto E[( X ) ]/ è 3 ( tale valore occorre<br />

se la distribuzione della v.a. X è gaussiana); per tale valore si ha<br />

2<br />

2 <br />

ˆ n,1 n <br />

4<br />

2<br />

1<br />

per cui il coefficiente di variazione della nostra distribuzione campionaria vale<br />

2<br />

ˆn,1 [ ˆn,1]<br />

2 2 2 2<br />

E E <br />

<br />

<br />

n 1 2<br />

<br />

<br />

<br />

E[<br />

ˆ ]<br />

n 1<br />

2 2<br />

n,1<br />

Per una distribuzione che si vuole piuttosto addensata intorno al valor medio si può<br />

richiedere che il coefficiente di variazione non superi il 20%; per cui<br />

2<br />

0.2 n 51<br />

n 1<br />

Se poi la Curtosi è compresa tra 0 e 2, come nei casi di asimmetria, si ricava n 100 . Se<br />

invece la Curtosi è compresa tra 2 e 20, come nei casi di distribuzione con probabilità non<br />

trascurabile di presentare valori eccezionali (code grasse), si ottiene n 500 .<br />

Se la Curtosi è inferiore a 0 occorre sempre che n 50 .<br />

Le stesse conclusioni si ottengono nel caso di non indipendenza del campione.<br />

Riassumendo possiamo dire che, nel caso di campione indipendente, la stima centrata<br />

2<br />

2<br />

ˆ ˆ della varianza <br />

n<br />

ˆ di ˆ <br />

n n è data da<br />

<br />

ˆ <br />

2<br />

ˆ <br />

n<br />

2<br />

2 2<br />

2 n,1 2 n sn<br />

ˆ sn<br />

<br />

n<br />

<br />

<br />

n<br />

ˆ 1<br />

n n n1 n1<br />

mentre nel caso di campione con elementi non indipendenti si ha<br />

31


32<br />

2<br />

2 N n<br />

ˆ <br />

n n N 1<br />

2 2<br />

2 ˆ n,2 N n 1 2 n N 1N n<br />

sn n <br />

ˆ ˆ s<br />

1<br />

n<br />

n <br />

n N 1 n n1 N N 1 n1 N <br />

Vediamo un semplice esempio. Si è ricevuto un lotto di N 1000 barrette di ferro<br />

qualitativamente omogenee, ovvero ottenute con un ciclo di produzione in cui tutti i fattori<br />

caratteristici sono stati mantenuti costanti (fornitore delle materie prime, stesse macchine operatrici<br />

utilizzate, stessa squadra di operai). Da un campione di n 50 unità si è ricavato che le barrette<br />

2 2<br />

hanno un diametro medio di ˆ n 3.5mm<br />

con una varianza campionaria sn 0.09mm<br />

. Si stima<br />

quindi il valore medio dei diametri su tutto il lotto con il valore ˆ n 3.5mm<br />

, che sappiamo<br />

essere una stima non affetta da errore sistematico. Per valutare la variabilità della stima supponiamo<br />

di avere preso un campione con gli elementi scelti tutti indipendentemente uno dall’altro<br />

(chiariremo poi questo concetto), allora la stima centrata della varianza<br />

2<br />

n<br />

2 s<br />

ˆ ˆ 0.00183<br />

n n 1<br />

2<br />

ˆn è data da<br />

mentre nel caso che gli elementi del campione non siano scelti tutti indipendentemente uno<br />

dall’altro si ha<br />

2<br />

n<br />

2 s n <br />

ˆ ˆ 1 0.00174<br />

n <br />

n1 N <br />

Nell’ipotesi che la distribuzione dei valori del diametro delle barrette possa ritenersi<br />

gaussiana nel lotto, dato che n 50 , la stima di ˆ n è da ritenersi accurata, nel senso che il<br />

2<br />

coefficiente di variazione della stima della sua varianza ˆ ˆ è non superiore al 20%.<br />

n<br />

Se volessimo rendere la stima ˆ n più accurata dovremmo aumentare la numerosità del<br />

2<br />

campione; infatti, volendo ridurre la varianza ˆ ˆ a 0.0004 otterremmo<br />

n<br />

nel caso di campionamento indipendente e<br />

0.09 0.09<br />

0.0004 n 1226 n 1<br />

0.0004<br />

0.09 n 1000(0.09 0.0004)<br />

0.0004 1 n 184<br />

n 1 1000 <br />

0.0004*1000 0.09


nell’altro caso.<br />

Il prelievo del campione fatto in modo che tutti gli elementi siano scelti in modo<br />

indipendente uno dall’altro significa in sostanza che il fatto di selezionare un elemento dalla<br />

popolazione per metterlo nel campione, non deve alterare la composizione statistica della<br />

popolazione. Questo può essere ottenuto sostanzialmente in due modi: se la dimensione della<br />

popolazione non è molto grande rispetto a quella del campione da prelevare si effettua un<br />

campionamento con reinserzione; nel caso contrario se N n si può ritenere che il prelievo del<br />

campione alteri la composizione statistica della popolazione in modo trascurabile. Naturalmente la<br />

reinserzione può essere praticata se l’analisi del campione non modifica in alcun modo i suoi<br />

elementi: nell’esempio della misura del diametro delle barrette questo si verifica, ma nell’esempio<br />

della misura del carico di rottura, l’elemento analizzato verrebbe distrutto e quindi diventerebbe non<br />

reinseribile! In questo caso il campionamento sarebbe necessariamente senza reinserzione, e la<br />

indipendenza del campione dipenderebbe solo, come detto, dal confronto tra la numerosità della<br />

popolazione e quella del campione stesso!<br />

Riassumiamo con una tabella sinottica i risultati della stima puntuale di valore medio e<br />

varianza di una popolazione ottenuta da un campione dei suoi elementi<br />

Valori di<br />

popolazione<br />

Valor medio <br />

Stime campionarie<br />

Campione indipendente Campione non indipendente<br />

1 n<br />

ˆ x<br />

n<br />

n j<br />

j1<br />

ˆ <br />

1<br />

n<br />

n<br />

n x j<br />

j1<br />

2<br />

Varianza 2<br />

2 n 2<br />

ˆ n,1 sn n1 1 n<br />

x ˆ j n<br />

n1<br />

j1<br />

2<br />

2 n N 1 2 N 1 1 n <br />

ˆ ˆ<br />

n,2 sn xj<br />

n<br />

<br />

n1 N N n1 j1<br />

<br />

2<br />

Varianza ˆ n<br />

della stima ˆ n<br />

2 2<br />

ˆ 2 n,1 1 2 n sn<br />

ˆ ˆ s<br />

n<br />

n <br />

n n n1 n<br />

1<br />

2 2<br />

ˆ 2 n,2 N n sn n <br />

ˆ ˆ 1<br />

n<br />

<br />

n N 1 n1 N <br />

2<br />

4<br />

4 <br />

2 1 n<br />

E <br />

2 X <br />

n 3<br />

sn xj mn<br />

; <br />

2<br />

2 (varianza di ˆ 4<br />

n j1<br />

ˆ <br />

n,1<br />

, valore di popolazione)<br />

n,1<br />

n n1<br />

<br />

33


34<br />

Stima di intervallo e controllo statistico della qualità<br />

Quindi abbiamo visto come la media aritmetica ˆ n costituisca una buona stima del valore<br />

2<br />

n<br />

medio di una v.a. X con varianza , di cui si sono considerati n determinazioni xii 1<br />

indipendenti; si è supposto quindi che il campione di dati sperimentali sia stato prelevato da una<br />

popolazione molto grande, ovvero sia stato prelevato con reinserzione da una popolazione finita. In<br />

tale caso si ha<br />

E[ ˆ ] ,<br />

n<br />

2 2<br />

n n,1<br />

E[( ˆ ) ] ˆ / n .<br />

Come si vede, la stima di valor medio è una stima accurata in quanto ha distorsione nulla, e la sua<br />

precisione aumenta all'aumentare della dimensione n del campione casuale analizzato, in quanto la<br />

varianza della stima è inversamente proporzionale a n .<br />

In definitiva, il parametro incognito viene valutato mediante una sua stima puntuale ˆ n che ha<br />

una variabilità misurata da 2 ˆ n,1<br />

/ n . Questo significa che se si analizzassero più campioni di<br />

dimensione n , si otterrebbero tanti valori differenti della stima puntuale ˆ n , ma che si localizzano<br />

intorno al valore incognito , potendo peraltro presentare errori ˆ n positivi e negativi che<br />

hanno mediamente un range dell'ordine di ˆ n,1<br />

/ n .<br />

Da quanto detto la stima puntuale del valor medio per essere apprezzabile deve essere<br />

accompagnata anche dal valore della sua dispersione, cioè dalla misura della sua variabilità.<br />

Ci si chiede quindi se non sia possibile rappresentare la stima con un unico elemento che faccia<br />

comparire in modo esplicito la variabilità della stima. In altre parole appare di più facile<br />

interpretazione poter fornire un intervallo I ,n di possibili valori tale che si possa ritenere con una<br />

certa confidenza che il valore incognito appartenga a tale intervallo<br />

n <br />

P I, 1 %<br />

In questo caso non si fornirebbe un unico valore ˆ n per , attendibile a meno di un errore medio<br />

pari a ˆ n,1<br />

/ n , ma un intervallo I ,n di valori attendibili per con una confidenza dell' 1 % .<br />

Vediamo come fare.<br />

Consideriamo la v.a. standardizzata<br />

ˆ n <br />

n<br />

<br />

ˆ / n<br />

n,1<br />

che ha quindi valor medio nullo e varianza pari a 1. Se si conoscesse la distribuzione di tale<br />

variabile aleatoria, potremmo risolvere il seguente problema: assegnato il valore % trovare il<br />

valore per cui risulti<br />

P n 1 <br />

%


Ora, dal teorema del limite centrale sappiamo che per n la variabile standardizzata n tende<br />

in distribuzione ad una gaussiana standard N (0,1) . Questo implica che, se n è abbastanza grande ,<br />

la probabilità dell'evento n possa essere calcolata usando la distribuzione limite<br />

A questo punto, scelto %<br />

2<br />

t<br />

/2<br />

e<br />

P n dt<br />

2<br />

, il valore di tale che 1 %<br />

<br />

P è dato dal percentile<br />

della gaussiana, ottenibile dall'opportuna tabella dei percentili. Infatti si ricordi che il valore <br />

che risolve il problema precedente, risolve anche il seguente<br />

%<br />

P P<br />

che fa riferimento all'evento complementare, ed è esattamente l'evento che viene considerato sulle<br />

tabelle dei percentili.<br />

A questo punto sappiamo che con una confidenza del 1 % il valore n ottenuto dai dati<br />

sperimentali sarà compreso nel seguente intervallo<br />

cioè<br />

da cui con semplici passaggi si ottiene<br />

n<br />

e quindi, ricordando che ˆ ,1 s<br />

n 1<br />

n <br />

ˆ <br />

<br />

n<br />

<br />

ˆ n,1<br />

/ n<br />

ˆ ˆ <br />

ˆ ˆ <br />

n n<br />

2 2<br />

n n<br />

n,1 n,1<br />

n n <br />

, si ha<br />

s<br />

ˆ n s<br />

ˆ<br />

n<br />

n n <br />

n1 n<br />

1<br />

L’ultima relazione stabilisce un intervallo di confidenza I ,n cui apparterrà il valore<br />

incognito della media della popolazione con probabilità 1 % . Come si vede dalla sua<br />

espressione, fissato % , l’ampiezza I ,n<br />

di tale intervallo dipende sostanzialmente dalla<br />

numerosità del campione<br />

s<br />

, ˆ n s<br />

ˆ n sn<br />

I n n n 2<br />

n1 n1 n1<br />

per cui, all'aumentare della dimensione del campione analizzato, a parità di confidenza,<br />

n<br />

35


36<br />

l'intervallo I ,n diventa più stretto, dando luogo ad una valutazione più precisa dei valori attendibili<br />

del parametro incognito .<br />

Ovviamente nel caso che il campione fosse stato non casuale, con ragionamenti del tutto<br />

analoghi, avremmo ottenuto I ,n pari a<br />

di lunghezza pari a<br />

s<br />

ˆ n n s<br />

1 ˆ<br />

n n<br />

n n 1<br />

n1 N n1<br />

N<br />

sn n<br />

I, n 2 1<br />

n 1<br />

N<br />

Nell'espressione dell'intervallo di confidenza si è potuto utilizzare il percentile della gaussiana<br />

standard nell'ipotesi che n fosse abbastanza grande da ritenere soddisfatto il teorema del limite<br />

centrale, ed utilizzare quindi la distribuzione limite per calcolare la probabilità degli eventi della<br />

variabile n . Se la distribuzione dei dati fosse gaussiana, allora basterebbe n 50 . Se invece fosse<br />

dissimmetrica, con una curtosi al più uguale a 2, allora dovrebbe essere n 100 . Se infine si avesse<br />

un'alta probabilità di avere valori estremi (cioè molto lontani dalla media) , con curtosi quindi<br />

maggiore di 2, allora dovrebbe essere 500<br />

n .<br />

Nel caso in cui i dati a disposizione non soddisfacessero nessuna delle condizioni<br />

precedenti, ad esempio n 30 sempre per un campione casuale, allora si può avere la distribuzione<br />

della v.a. standardizzata n solo nel caso in cui si possa validare un'ipotesi di gaussianità dei dati.<br />

In tal caso infatti la variabile standardizzata<br />

ˆ n <br />

n<br />

<br />

s / n 1<br />

ha distribuzione t-student con n 1 gradi di libertà, per cui il valore per cui, fissato % , si ha<br />

n<br />

P n 1 % oppure P %<br />

è dato dal percentile t della distribuzione t-student con n 1 gradi di libertà (ottenibile<br />

dall'opportuna tabella dei percentili) , ottenendo per l’intervallo di confidenza<br />

sn sn<br />

ˆ ˆ<br />

n t n t<br />

n1 n<br />

1<br />

Vediamo un esempio. Un’officina meccanica deve stimare il carico medio di rottura di un<br />

cospicuo lotto di pezzi. Si seleziona un campione di 100 unità e si determina m 1115 2<br />

Kg/ cm e<br />

n


2<br />

sn 2,16 Kg/ cm . Dalla tabella della N(0,1) si ricava che con 0.05 sia ha 1.96 , per cui<br />

il carico di rottura medio si trova nell’intervallo<br />

2.16 2.16 <br />

1115 1.96 ,1115 1.96 1114.57,1115.42 /<br />

100 1100 1<br />

2<br />

kg cm<br />

con una confidenza di 0.95. Se aumentassimo il campione analizzato a 300 unità si otterrebbe un<br />

intervallo di confidenza dello 0.95 pari a<br />

2.16 2.16 <br />

1115 1.96 ,1115 1.96 1114.8,1115.2 /<br />

300 1300 1<br />

2<br />

kg cm<br />

quindi più ristretto rispetto al precedente, costituendo quindi un intervallo di valori più preciso per il<br />

carico di rottura medio .<br />

La stessa officina vuole determinare il valore medio dello spessore di un lotto di lamine; tale<br />

2<br />

grandezza risulta avere distribuzione gaussiana con media e varianza incognite. Si preleva<br />

un campione di 14 barrette e si determina n 52.52 mm e sn 3.37 mm.<br />

Siccome n 30,<br />

stavolta dobbiamo usare la distribuzione t-student per determinare l’intervallo di confidenza per lo<br />

spessore medio . Dalla tabella per 0.05 si ottiene t 2.160 per 13 gradi di libertà, per cui si<br />

ha<br />

con confidenza pari a 0.95.<br />

3.37 3.37 <br />

52.52 2.16 , 52.52 2.16 50.5011,54.5389<br />

14 114 1<br />

<br />

37


38<br />

Controllo di qualità.<br />

L’intervallo di confidenza viene utilizzato nel controllo statistico della qualità di un processo<br />

di produzione. In condizioni nominali le unità prodotte presentino, per quanto concerne un certo<br />

2<br />

attributo, una distribuzione gaussiana con un valor medio ed una varianza , noti perché<br />

determinati in modo preliminare (cioè determinati con un esperimento dedicato, con un campione di<br />

dati differente da quelli attualmente in esame) usando i metodi descritti precedetemente. Per<br />

controllare che il processo mantenga la qualità nel tempo, vengono prelevati ad intervalli regolari<br />

dei campioni di dimensione n e su questi si calcola la media campionaria ˆ n ; dato che la<br />

distribuzione si suppone gaussiana, n può essere scelto anche piccolo, ad esempio 5 o 10, e la<br />

variabile normalizzata<br />

ˆ n <br />

n<br />

<br />

/ n<br />

è certamente N(0,1); quindi fissando 0.05 otteniamo 1.96 per cui<br />

Ciò significa che l’evento<br />

<br />

P<br />

ˆ n 0.95 n <br />

<br />

ˆ n <br />

n n<br />

<br />

ˆ n n n<br />

occorre con probabilità del 95%. La qualità del processo di produzione è quindi da ritenersi idonea<br />

se ˆ n si mantiene nell’intervallo <br />

<br />

/<br />

ˆ n<br />

n, <br />

/ n<br />

<br />

<br />

/ n<br />

<br />

<br />

/ n<br />

<br />

<br />

tempo


Qualora ˆ n dovesse uscire dai limiti prefissati si dovrebbe intervenire subito per individuare le<br />

cause che hanno determinato questo scostamento significativo della qualità della produzione dallo<br />

standard (utensile logorato, inquinamento dei reagenti, ecc.).<br />

Test di confronto.<br />

In molti casi pratici si deve poter confrontare la stima di campionaria di una statistica ( media,<br />

varianza, frequenza relativa) con valori considerati come noti, evidentemente acquisiti da indagini<br />

precedenti. Esaminiamo ad esempio il seguente caso.<br />

Una compagnia di televisione via cavo asserisce che il 60% degli abitanti della zona di<br />

esercizio possiede la televisione via cavo, mentre una compagnia di televisione satellitare crede che<br />

il precedente valore sia troppo grande, dopo aver effettuato un rilevamento per cui 81 abitazioni<br />

avevano la televisione via cavo e 69 ne erano sprovviste. La compagnia di televisione via cavo<br />

afferma che tale differenza è solo dovuta al caso. A quale delle due compagnie dareste ragione, con<br />

una confidenza del 95%?<br />

La compagnia di televisione via cavo sostiene che in media la proporzione p delle persone<br />

nella popolazione di riferimento che hanno la tv via cavo è pari a 0.6, potendo la proporzione<br />

effettiva variare entro certi limiti. Il valore di questa proporzione, risultante dall'esame del campione<br />

di abitazioni effettuato dalla compagnia di tv satellitare, è di 81/(81+69)=0.54. C'è quindi uno<br />

scostamento significativo del valore stimato della proporzione pˆ 0.54 dal valore di riferimento<br />

ipotizzato p 0.6 . La compagnia di tv via cavo sostiene che tale scostamento rientra nella<br />

variabilità naturale insita nella stima campionaria di p ; per cui l'ipotesi nulla è che il valore di<br />

riferimento della proporzione di abitazioni con tv via cavo sia del 60%<br />

Confronto tra proporzioni<br />

H<br />

H<br />

0<br />

1<br />

: p 0.6<br />

: 0.6<br />

Per validare o meno questa ipotesi, basta appunto misurare la variabilità della stima della<br />

2<br />

proporzione p e costruire un set critico con significatività del 5%<br />

p p 2 p<br />

con il percentile del 10% in modo che la singola coda misuri 5%. La regola di rifiuto dell'ipotesi<br />

nulla è unilaterale perché pˆ p e la compagnia di tv satellitare ritiene che appunto che p 0.6<br />

sia troppo grande.<br />

La misura delle proporzioni segue la distribuzione binomiale: in una popolazione in cui un<br />

dato evento occorre con probabilità p 0 , la probabilità con cui si avranno k risultati favorevoli<br />

all'evento su un campione di N unità (caso delle prove ripetute di Bernoulli) è pari a<br />

N N !<br />

PX ( k) p (1 p) p (1 p)<br />

k <br />

( N k)! k!<br />

p<br />

k Nk k Nk 0 0 0 0<br />

La variabile aleatoria X data dal "n° di successi su N prove indipendenti" viene detta binomiale<br />

ed ha valor medio e varianza pari a<br />

39


40<br />

2<br />

X Np0 X Np0 p0<br />

, (1 )<br />

Tale distribuzione è simmetrica per qualunque N se 0 0.5 p , mentre tende ad essere simmetrica<br />

per qualunque p 0 quanto più N è grande. Dalla distribuzione di X si ottiene subito la distribuzione<br />

della proporzione p X del numero di successi su N prove ripetute: essa è ancora una<br />

N<br />

binomiale, ma con media e varianza pari a<br />

2<br />

X 2 0(1 0)<br />

0, X p p<br />

p p p <br />

N 2<br />

N N<br />

Si dimostra inoltre che se Np0(1 p0)<br />

10 si ha<br />

p p pp0 <br />

: N 0,1 p p0(1 p0)<br />

N<br />

cioè, la variabile aleatoria standardizzata ha distribuzione limite pari alla gaussiana standard. Questo<br />

risultato al solito è fondamentale per dedurre i percentili per gli intervalli di confidenza che<br />

riguardano la variabile aleatoria p . Nel caso in esame infatti abbiamo<br />

e il set critico cercato è pari a<br />

p0(1 p0)<br />

p p00.6, p 0.04, Np0(1 p0)<br />

36 10<br />

N<br />

pˆ 0.6 1.6450.04 0.5342<br />

p 2 p<br />

per cui, dato che pˆ 0.54,<br />

dobbiamo concludere che la compagnia di tv via cavo aveva ragione,<br />

con un rischio del 5% di prendere la decisione sbagliata.<br />

Nel prossimo caso le proporzioni da confrontare sono estratte da due campioni differenti.<br />

La malattia di Lyme o Borreliosi è una infezione batterica che colpisce le articolazioni, il sistema<br />

nervoso, gli organi interni e la pelle dei gatti. Il contagio avviene per via delle zecche. Vogliamo<br />

valutare l'efficacia di un nuovo antibiotico X nella terapia contro la Borrelliosi, confrontandola<br />

con quella dell' amoxicillina. A questo scopo, analizziamo i test clinici su una popolazione di gatti<br />

affetti da Borrelliosi in cura presso alcuni ambulatori veterinari in un trimestre. I dati raccolti sono<br />

riportati in tabella<br />

guariti non guariti totale % guariti<br />

X 56 14 70 80<br />

amoxicillina 52 23 75 69.33<br />

totale 108 37 145 74.48


In particolare, si noti che su un totale di 145 gatti, 70 sono stati sottoposti a trattamento con il nuovo<br />

antibiotico X e di questi l'80% sono guariti ( 56 su 70). Per i restanti 75 gatti, trattati con<br />

amoxicillina, si è avuta una percentuale di guarigione pari al 69.33% (52 su 75). Sembrerebbe che il<br />

nuovo farmaco sia più efficace. Tuttavia, bisogna assicurarsi che la differenza tra le percentuali dei<br />

guariti nei due gruppi sia significativa e non dovuta al caso.<br />

Nel gruppo di gatti trattati con X si ha quindi una proporzione pˆ 1 0.8 di soggetti guariti su un<br />

campione di n1 70 unità, prelevato da una popolazione in cui la proporzione dei guariti è un<br />

2 p<br />

valore p 1 . Per quanto visto precedentemente sia ha che Ep [ ˆ1]<br />

p1<br />

e 1(1 p1)<br />

pˆ<br />

.<br />

1 n1<br />

Analogamente per il gruppo di n2 75 unità trattato con amoxicillina si osserva una proporzione di<br />

soggetti guariti pˆ 2 0.7 , con Ep [ ˆ2]<br />

p2<br />

e <br />

2 2 2<br />

pˆ<br />

2 n2<br />

41<br />

p (1 p )<br />

. Ora come statistica del test possiamo<br />

scegliere la differenza delle proporzioni p pˆ1 pˆ2,<br />

che avrà valor medio pari a E p p1 p2,<br />

2 2 2<br />

e varianza ˆ p p 1 p dato che i due gruppi di dati sono indipendenti. Dobbiamo quindi testare<br />

2<br />

le seguenti ipotesi<br />

1<br />

<br />

<br />

H0: E p p1 p2<br />

0<br />

H : E p 0<br />

L'ipotesi nulla H0 si riferisce al caso in cui i due trattamenti sono equivalenti e la differenza tra le<br />

proporzioni osservate è del tutto casuale. La statistica del test, se è vera H 0 è<br />

<br />

pE p p p<br />

<br />

2 2 2 2<br />

pˆ 1 pˆ <br />

2 pˆ <br />

1 pˆ<br />

1 1 <br />

2 p0(1 p0)<br />

<br />

n n<br />

1 2 <br />

dove p0 è la proporzione totale di guariti sull'unione dei due gruppi<br />

56 52<br />

p0<br />

0.7448<br />

70 75<br />

Se n1n2 p01 p0<br />

10,<br />

la statistica del test ha distribuzione gaussiana standard, per cui il set<br />

critico del test è<br />

p<br />

<br />

1 1 <br />

p0(1 p0)<br />

<br />

n n<br />

1 2 <br />

con <br />

percentile dell' %<br />

di (0,1)<br />

N . Nel nostro caso, volendo effettuare un test con significatività<br />

del 5%, otterremmo


42<br />

0.80 0.6933<br />

1.3802 1.96<br />

1 1 <br />

0.7448(1 0.7448) <br />

70 75 <br />

per cui dovremmo accettare l'ipotesi H 0 e ritenere che il nuovo farmaco X abbia avuto un effetto<br />

non significativamente differente da quello ottenuto con l' amoxicillina. In effetti, volendo testare se<br />

sia conveniente usare il nuovo farmaco, avremmo fatto meglio ad eseguire un test unilaterale,<br />

impostando l'ipotesi alternativa sul fatto che ci si aspetta che il nuovo farmaco abbia una<br />

percentuale di guariti superiore rispetto all'amoxicillina, i.e. H1 : Ep <br />

0.<br />

Consideriamo ora un altro caso di studio.<br />

Per valutare l’efficacia antirughe, elasticizzante, “ridensificante” e riparatrice per la barriera<br />

cutanea di un trattamento cosmetico è stato eseguito uno studio 1 clinico su 10 soggetti sani di sesso<br />

femminile. Vengono riportati in tabella i dati relativi all'elasticità cutanea prima del trattamento<br />

(tempo T 0 ) e dopo quindici giorni di trattamento (tempo T 15 ). Il trattamento cosmetico è stato<br />

efficace?<br />

Confronto tra medie, misure appaiate<br />

Per rispondere al quesito si può ragionare così. Per ogni soggetto si<br />

misura la stessa grandezza, l'elasticità cutanea, in due tempi<br />

differenti. Per cui in effetti è come se si misurasse la variazione di<br />

elasticità cutanea per ogni soggetto; di conseguenza alla tabella<br />

precedente potremmo sostituire quella ottenuta dalle differenze dei<br />

dati per ogni soggetto<br />

0.0345 -0.0054 0.0244 0.0402 0.0625 0.0400 -0.0196 -0.0281 0.0006 0.0695<br />

con media ˆ d 0.0219 e deviazione standard ˆ d 0.0336 .<br />

Ora se il trattamento non ha avuto effetto, vuol dire che mediamente le differenze dei valori<br />

dell'elasticità cutanea è zero; mentre si avranno effetti significativi se la media delle differenze è<br />

significativamente differente da zero. Per cui, se la nostra ipotesi nulla corrisponde all'assenza di<br />

effetto significativo del farmaco, possiamo scrivere<br />

H0: Eˆ<br />

d<br />

<br />

0<br />

H : E ˆ 0<br />

1<br />

<br />

1 http://www.biotivia.cc/attachments/down/Celle%20-%20CLINICAL%20TEST.pdf<br />

d


in quanto per l'ipotesi alternativa dobbiamo considerare che l'effetto del cosmetico deve produrre un<br />

aumento dell'elasticità cutanea. Possiamo quindi disporre un test unilaterale di ipotesi semplice con<br />

un livello di significatività del 5%; il set critico avrà quindi la seguente forma<br />

<br />

ˆ E ˆ ˆ E ˆ <br />

d d 2 ˆ d 2<br />

Facciamo ora l'ipotesi di gaussianità dei dati (da verificare eventualmente con un opportuno test); in<br />

questo modo potremo scegliere il percentile 2 come il percentile del 10% di una t-Student a 9<br />

gradi di libertà ottenendo il seguente set critico<br />

0.0336<br />

ˆ d 0 1.833 0.0195<br />

10<br />

Dato che ˆ d 0.0219 è maggiore di 0.0195, dobbiamo rifiutare l'ipotesi nulla e ritenere, con una<br />

confidenza del 95%, che il cosmetico abbia avuto effetto.<br />

Nel caso esaminato, la variabilità dei dati era legata alla presenza di soggetti differenti in uno stesso<br />

gruppo. In altre situazioni i dati variano anche per il fatto che i dati si riferiscono a gruppi differenti<br />

di soggetti. Il caso che segue chiarisce questo aspetto. Per semplicità di notazioni, le medie<br />

calcolate su due gruppi di n 1 e n 2 dati, saranno indicate con 1 ˆ e ˆ 2 anziché ˆ n1, ˆ n2.<br />

Un’azienda produce disinfettante industriale concentrato, in confezioni per le quali dichiara che è<br />

possibile ottenere mediamente 150 litri di disinfettante con una varianza pari a 36 litri 2 . La<br />

produzione avviene in due stabilimenti separati. Un primo rivenditore analizza un campione casuale<br />

di 225 confezioni, prelevato dal primo stabilimento, e ottiene una media 1 ˆ di 148 litri di<br />

disinfettante; un secondo rivenditore analizza un campione casuale di144 confezioni, prelevato<br />

dall'altro stabilimento, e ottiene una quantità media ˆ 2 di disinfettante pari a 151 litri. La differenza<br />

tra queste rilevazioni è significativa oppure è da ritenersi dovuta alla naturale variabilità del<br />

prodotto?<br />

Confronto tra medie, misure non appaiate, varianza nota<br />

Come sappiamo, la stima di valor medio è centrata, per cui risulta che 1 ˆ E[ ] con varianza<br />

2<br />

2 36<br />

2 36<br />

ˆ 0.16 e E[ ˆ <br />

1<br />

2]<br />

con varianza ˆ 0.25 . Ora possiamo scegliere<br />

2<br />

n 225<br />

n 144<br />

come statistica del test la differenza tra i valori medi rilevati sui due campioni indipendenti<br />

ˆ ˆ ˆ , per la quale possiamo testare le ipotesi<br />

d<br />

2 1<br />

1<br />

d<br />

ˆ d<br />

<br />

ˆ <br />

H0: E 0<br />

H : E <br />

0<br />

d<br />

2<br />

ˆ <br />

d<br />

n<br />

43


44<br />

L'ipotesi nulla corrisponde al caso in cui la differenza osservata sia da attribuire al caso, mentre<br />

l'ipotesi alternativa corrisponde al fatto che i due stabilimenti hanno una differenza sistematica nella<br />

produzione del disinfettante. Se è vera H 0 abbiamo che E[ ˆ d ] 0 mentre, indipendentemente da<br />

2 2 2<br />

H0, H 1 risulta ˆ1 ˆ 0.16 0.25 0.41<br />

d . La scelta dell'ipotesi alternativa determina un<br />

2<br />

set critico bilaterale<br />

ˆ E[<br />

ˆ ] ˆ <br />

<br />

d d d<br />

d<br />

2<br />

2<br />

<br />

1 2<br />

Se possiamo validare un'ipotesi di gaussianità dei dati, possiamo scegliere =1.96 corrispondente<br />

al percentile del 5% di una gaussiana standard. In questo caso si otterrebbe<br />

ˆ d<br />

151148 3<br />

4.685 1.96<br />

0.41 0.41<br />

2 2<br />

<br />

1 2<br />

Si dovrebbe quindi accettare l'ipotesi alternativa e ritenere che ci siano cause sistematiche nel<br />

processo di produzione dei due stabilimenti che determina una differenza significativa nella qualità<br />

del prodotto fornito.<br />

Il più delle volte la varianza dei dati, differentemente dal caso appena esaminato, è incognita.<br />

Questo accade ad esempio nel problema che segue 2 .<br />

E' stato condotto uno studio clinico per la valutazione<br />

dell’efficacia della Tulatromicina nella prevenzione delle<br />

forme respiratorie del bovino da carne (BRD), nelle normali<br />

condizioni d’allevamento italiane. La patologia esordisce<br />

con sintomi generali (abbattimento e riduzione<br />

dell’appetito) che, nell’arco di poche ore, si accompagnano<br />

a febbre, dispnea, tosse, scolo nasale (catarrale e/o muco<br />

purulento, vedi figura) e nei casi più gravi e senza un<br />

adeguato intervento, evolvono in pochi giorni verso una<br />

polmonite grave che può condurre a morte l’animale.<br />

In tabella vengono riportati i dati relativi all'esperimento: un<br />

gruppo di n1 89 bovini è stato trattato con Tulatromicina ed<br />

un secondo gruppo n2 81con<br />

Tilmicosina. Dopo 60 giorni<br />

si è osservato un peso medio per il primo gruppo di<br />

ˆ 1 537.39 Kg con una deviazione standard<br />

1 ,1 ˆ n 42.96<br />

Kg, mentre per il secondo gruppo si è ottenuto un peso<br />

ˆ 529.49 Kg con una deviazione standard<br />

ˆ 41.47 Kg.<br />

n<br />

2 ,1<br />

medio 2<br />

2 Tratto da: M. Muraro et al. Large Animal Review 2008; 14: 267-272 267.


Confronto tra medie, misure non appaiate, varianza incognita<br />

Siamo in presenza ancora di un caso in cui i dati appartengono a due gruppi differenti di soggetti<br />

per cui essi non possono considerarsi appaiati. Si devono confrontare quindi due medie per capire se<br />

la loro differenza sia significativa o dovuta al caso. La varianza dei dati è incognita, ma le varianze<br />

del peso dei bovini sono state stimate dai dati dei due campioni di 89 e 81 unità. Nell'ipotesi (da<br />

verificare con un test ovviamente!) che la varianza dei dati sia costante, e che la differenza tra ˆ n<br />

e<br />

2<br />

2,1<br />

ˆ n<br />

sia del tutto casuale, la varianza di d 2 1<br />

ˆ ˆ ˆ è data dalla seguente espressione<br />

2 2<br />

ns n1 n1<br />

2 1 n n 2 2<br />

1 2sn<br />

2 1 1 2 1 2 1<br />

, <br />

1 1, ˆ1, 2<br />

2, ˆ<br />

d<br />

sn x i sn x i 2<br />

n1 n2 2 n1 n2 n1 i1 n2<br />

i1<br />

<br />

<br />

che viene detta pooled variance. In questo caso, nell'ipotesi di gaussianità dei dati, la statistica del<br />

test di confronto tra medie<br />

H0: Eˆ<br />

d<br />

<br />

0<br />

H1: E<br />

ˆ d<br />

<br />

0<br />

è data da<br />

ˆ d<br />

2 2<br />

ns 1 n n<br />

1 2sn<br />

2 1 1 <br />

<br />

n1n2 2n1 n2<br />

<br />

e segue una distribuzione t-Student a n1n2 2 gradi di libertà. Per cui il set critico unilaterale di<br />

significatività % sarà dato da<br />

Nel caso di studio si ottiene<br />

ˆ d<br />

t<br />

2 2<br />

ns 1 n n<br />

1 2sn<br />

2 1 1 <br />

<br />

n1n2 2n1 n2<br />

<br />

n1n22,2 7.9<br />

1.2174t168,0.10 1.645<br />

6.4891<br />

per cui si accetta l'ipotesi nulla e si conclude che il trattamento con Tulatromicina non ha avuto un<br />

effetto significativamente differente dal trattamento con Tilmicosina.<br />

Nel caso in cui si debba rifiutare l'ipotesi che la varianza dell'insieme dei dati del primo e del<br />

secondo gruppo sia costante, allora si può usare la seguente statistica<br />

<br />

45<br />

2<br />

1,1


46<br />

ˆ <br />

ˆ <br />

d<br />

2 2<br />

ˆ<br />

n1,1<br />

n2,1<br />

<br />

n1 n2<br />

che seguirà approssimativamente una distribuzione t-Student, nell'ipotesi di gaussianità dei dati, con<br />

gradi di libertà ottenuti dal termine di correzione di Welch- Satterwhaite<br />

t<br />

gdl,<br />

<br />

2 2 ˆ n1,1 ˆ <br />

n2,1<br />

<br />

n n <br />

gdl <br />

2 2<br />

n1,1 n2,1<br />

<br />

n1 n2<br />

<br />

<br />

<br />

<br />

n 1 n 1<br />

1 2 <br />

ˆ <br />

2<br />

ˆ <br />

2<br />

1 2<br />

ovviamente si prende come numero di gradi di libertà il valore intero della precedente espressione.<br />

Confronto tra varianze<br />

I test di confronto tra proporzioni e tra medie appena visti, possono applicarsi anche al caso in cui<br />

si debbano confrontare le varianze.<br />

Si consideri a esempio un insieme di dati per cui si ipotizzi una distribuzione gaussiana con media<br />

e varianza<br />

2<br />

. Si estragga un campione casuale di n unità è si verifichi l'ipotesi<br />

H<br />

H<br />

2 2<br />

0 : n,1<br />

2 2<br />

1 : n,1<br />

Se l'ipotesi nulla è vera si può dimostrare facilmente che la grandezza<br />

ha distribuzione<br />

n<br />

2<br />

(<br />

xi<br />

ˆ n)<br />

2 2<br />

i1( n 1)<br />

n,1<br />

nsn<br />

<br />

2 2 2<br />

<br />

2<br />

n 1 con n 1 gradi di libertà. Il set critico per il test posto sarà quindi<br />

( n 1)<br />

n<br />

<br />

2<br />

2<br />

,1 2<br />

n1,<br />

<br />

2<br />

n 1, è il percentile dell' % . Nel caso in cui l'ipotesi alternativa fosse stata<br />

dove<br />

allora il set critico con significatività dell' % sarebbe stato<br />

( n 1)<br />

n<br />

<br />

2<br />

2<br />

2<br />

,1 2<br />

<br />

n1,1<br />

2 2<br />

1 : n,1<br />

H ,


2 2<br />

1 : n,1<br />

mentre se l'ipotesi alternativa fosse stata H<br />

di livello %<br />

, allora avremmo avuto il seguente set critico<br />

2 2<br />

( n1) <br />

n,1 2 ( n1)<br />

<br />

<br />

n,1<br />

2 <br />

<br />

2 n1,1 /2 <br />

2 n1,<br />

/2<br />

<br />

<br />

Concludiamo questo paragrafo considerando il caso di differenze tra varianze. Vogliamo<br />

confrontare le varianze di due campioni di dati con distribuzione gaussiana con parametri ( , )<br />

2<br />

e ( 2, 2)<br />

rispettivamente. Si vuole verificare l'ipotesi<br />

2 2<br />

H1: 1 2 . A questo punto dal primo campione di 1<br />

2<br />

dal secondo gruppo di n 2 dati stimiamo n ,1<br />

ˆ n e<br />

2<br />

2 2<br />

0: 1 2<br />

2<br />

1 1<br />

H contro l'ipotesi alternativa<br />

n dati stimiamo<br />

ˆ n e<br />

1<br />

2 ,1<br />

n1<br />

47<br />

, e analogamente<br />

(entrambi i gruppi si intendono essere due<br />

2<br />

campioni casuali di dati). Ora, per quanto visto prima, la variabile<br />

2<br />

n1<br />

1<br />

n<br />

1<br />

<br />

i1<br />

2<br />

i ˆ n<br />

2<br />

1 ( n1<br />

1)<br />

n1,1<br />

<br />

2 2<br />

1 1<br />

( x )<br />

è distribuita come una , mentre la variabile<br />

2<br />

n2<br />

1<br />

n<br />

2<br />

<br />

j1<br />

2<br />

j ˆ n2<br />

2<br />

( n2<br />

1)<br />

n2,1<br />

<br />

2 2<br />

2 2<br />

( x )<br />

è distribuita come una . Per cui, se l'ipotesi nulla è vera, la variabile<br />

2<br />

n1,1<br />

F1, <br />

2 2<br />

,1<br />

ha una distribuzione Fisher con 1 n11, 2 n2 1 gradi di libertà. Per cui il set critico di livello<br />

% per cui si rifiuta l'ipotesi nulla è<br />

2 2<br />

1: 1 2<br />

F F<br />

n2<br />

, , , <br />

1 2 1 2<br />

Se l'ipotesi alternativa fosse stata H , avremmo scelto come statistica del test il reciproco<br />

della precedente F'2, 1 1/ F1,<br />

ed il set critico sarebbe stato<br />

2<br />

F' F<br />

Infine, se l'ipotesi alternativa fosse stata<br />

, , , <br />

2 1 2 1<br />

2 2<br />

1: 1 2<br />

H avremmo ottenuto il seguente set critico


48<br />

Confronto tra varianze di più gruppi<br />

F' , F , , /2 F , F<br />

, , /2<br />

2 1 2 1 1 2 1 2<br />

In molti casi pratici l’insieme di dati in esame è costituito da più di due gruppi per i quali è<br />

necessario sapere se hanno tutti la stessa varianza, ovvero almeno due gruppi hanno varianza l’uno<br />

differente dall’altro. Nel primo caso si dice che l’insieme di dati è omoschedastico, nell’altro caso<br />

che è eteroschedastico. Per decidere se un insieme di dati sia omoschedastico si ricorre al solito a<br />

dei test satistici. Come dati di partenza si consideri un insieme di N dati costituito da k gruppi<br />

costituiti da n 1 , n2<br />

, , nk<br />

unità rispettivamente con medie 1 , 2<br />

, , k<br />

e con varianze<br />

2 2 2<br />

, , , k .<br />

1<br />

2<br />

Test di Bartlett. Nel caso in cui l’insieme di dati segua una distribuzione gaussiana si può usare<br />

questo test che prevede le seguenti ipotesi composte<br />

H<br />

H<br />

0<br />

1<br />

2<br />

: <br />

1<br />

2<br />

: <br />

La statistica del test è data dalla seguente variabile<br />

2 ,1<br />

i<br />

2<br />

2<br />

2<br />

j<br />

2<br />

k<br />

per almeno una coppia<br />

2<br />

p<br />

k<br />

k<br />

<br />

i1<br />

i<br />

2<br />

ni,1<br />

( N k)ln ˆ ( n 1)ln<br />

ˆ <br />

T <br />

1 1 1 <br />

1 <br />

<br />

3( k1) n 1 N k<br />

i1 i<br />

<br />

( i,<br />

j)<br />

dove le ˆ n sono le stime corrette delle varianze dei singoli gruppi, mentre<br />

i<br />

2 1 k<br />

2<br />

p ni 1<br />

ni,1<br />

N k i1<br />

<br />

ˆ ˆ <br />

è la sample pooled variance, che abbiamo già incontrato nel caso di due soli gruppi. Le due<br />

espressioni differiscono perché nel caso del confronto tra medie, la pooled variance si riferisce<br />

appunto alla varianza della stima di valor medio. La variabile T segue approssimativamente una<br />

distribuzione<br />

2<br />

k 1,<br />

per cui il set critico di livello % è dato da<br />

2<br />

k 1,<br />

T <br />

Se questo si verifica, l’ipotesi nulla viene rifiutata e l’insieme di dati si ritiene eteroschedastico.<br />

Test di Levene. Questo test è indicato nel caso in cui l’insieme di dati non segua una distribuzione<br />

x , il j-esimo dato dell' i-esimo gruppo, e si definiscano le seguenti grandezze<br />

gaussiana. Sia i j


1 i<br />

z x ˆ , ˆ x<br />

ij , ij , i i<br />

ni<br />

j1<br />

ij<br />

i<br />

n<br />

1 i<br />

<br />

ni<br />

j1<br />

i, j, i, j '<br />

1 k<br />

<br />

N i1<br />

i i, i, j<br />

z z media delle z nell i esimo<br />

gruppo<br />

z n z media dituttele z<br />

La statistica del test è data dalla seguente variabile<br />

che ha distribuzione di Fisher Fk 1 , N k<br />

N k<br />

W <br />

k 1<br />

n<br />

<br />

k<br />

i i<br />

i1<br />

k n j<br />

<br />

i1 j1<br />

<br />

n z z<br />

2<br />

zij , zi<br />

. Il set critico di livello % è il seguente<br />

W <br />

Fk<br />

1,<br />

N k , <br />

per cui se la grandezza W è più grande del percentile dell’ % della Fisher Fk 1 , N k<br />

, l’ipotesi nulla<br />

va rifiutata, e si deve ritenere l’insieme di dati eteroschedastico.<br />

ANOVA (Analysis of Variance) : confronto tra medie di più gruppi<br />

In molte situazioni, l’insieme o popolazione di unità da analizzare può presentare delle<br />

sottostrutture per cui il modello statistico rappresentato dalle medie di insieme (valore medio,<br />

varianza, …) può risultare in una descrizione troppo grossolana della variabilità insita nella<br />

popolazione: infatti parte di questa variabilità non è da attribuirsi al caso, all’evento aleatorio, ma<br />

alla presenza di una variabilità strutturata, determinata appunto da queste sottostrutture: in ognuna<br />

di queste gli elementi hanno un comportamento statisticamente omogeneo, ovvero presentano una<br />

variabilità interamente dovuta a cause aleatorie e bene descritta da medie di insieme, caratteristiche<br />

tuttavia del sottogruppo considerato; queste medie peraltro possono cambiare molto tra i vari<br />

sottogruppi per motivi non di natura aleatoria ma dovuti a meccanismi di natura sistematica! Si<br />

pensi ad esempio ad una produzione che venga effettuata da reparti con esperienza ed affiatamento<br />

differenti; alla vendita di articoli editoriali di varia natura: giornali, settimanali, audiovisivi;<br />

all’effetto di materie prime acquistate da fornitori differenti, come stoffe, filati , reagenti chimici, e<br />

chi più ne ha più ne metta! Consideriamo il caso di un portafoglio costituito da k 4 prodotti<br />

finanziari di cui interessa il numero di scambi giornalieri in borsa su un numero di 10 rilevazioni<br />

per ognuno di essi<br />

2<br />

49


50<br />

N° in migliaia di<br />

Scambi<br />

giornalieri<br />

Prodotti Finanziari<br />

1 2 3 4<br />

61 100 66 86<br />

80 74 52 35<br />

98 85 73 52<br />

64 77 69 70<br />

78 84 80 79<br />

73 95 73 43<br />

57 96 62 60<br />

95 62 50 65<br />

78 80 71 58<br />

86 87 84 82<br />

Media 77 84 68 63<br />

Il numero di rilevazioni per ciascuna classe non deve necessariamente coincidere, e le singole<br />

determinazioni possono considerarsi come estrazioni casuali indipendenti di una v.a. X . In<br />

generale quindi avremo n i , i 1, , k,<br />

rilevazioni sperimentali; indichiamo con x ij la j-esima<br />

rilevazione per la classe i-esima ( i 1, , k; j 1,<br />

, ni).<br />

Come si vede le medie interclasse ˆ i sono diverse tra loro e diverse dalla media di<br />

popolazione<br />

k ni xij, n<br />

k<br />

ni, ˆi<br />

ni<br />

xij<br />

i1 j1 i1 i j1<br />

1 1<br />

<br />

n n<br />

Vogliamo stabilire se questa variabilità è da attribuirsi al caso oppure è qualcosa di sistematico.<br />

Nell'ipotesi che la popolazione di dati possa ritenersi omoschedastica con distribuzione gaussiana,<br />

rappresentiamo il generico dato x ij nel seguente modo<br />

x a y<br />

ij i ij<br />

dove i a modella l’effetto della classe i-esima e y ij è una fluttuazione statistica che modelliamo<br />

come una gaussiana con media nulla e varianza<br />

2<br />

costante per tutte le classi; risulta che x ij è<br />

modellata come una gaussiana con media i i a<br />

2<br />

e varianza .<br />

A questo punto si vuole testare l’ipotesi composta<br />

0<br />

H : ai 0 per ogni i<br />

cioè che la differenza interclasse è da attribuirsi al caso, contro l’ipotesi alternativa<br />

H : ai 0 per almeno un i<br />

1


che tale differenza sia dovuta ad un fattore sistematico.<br />

Consideriamo la varianza campionaria totale<br />

k ni 2 k ni<br />

2 k<br />

2<br />

1 1 1<br />

n<br />

<br />

n<br />

<br />

n<br />

xij ˆ xij ˆ i ni<br />

ˆ i ˆ <br />

<br />

i1 j1 i1 j1 <br />

i1<br />

T V<br />

che con semplici passaggi può decomporsi nelle due varianze parziali V e W : la prima rappresenta<br />

la variabilità intraclasse, cioè la variabilità dei dati all’interno di ciascun gruppo di ni termini che è<br />

la stessa indipendentemente dal fatto che l’ipotesi H0 sia vera o falsa; la seconda fornisce la<br />

variabilità interclasse e, se l’ipotesi H0 è vera, risulta essere una fluttuazione casuale, altrimenti<br />

porta in conto la variabilità dovuta alle differenze tra le medie dei vari sottogruppi.<br />

Ora se l’ipotesi H0 è vera, la variabile T / risulta essere distribuita come una<br />

2<br />

W<br />

51<br />

2<br />

con<br />

n 1 gradi di libertà. In base al teorema di Cochran si può quindi dimostrare che V / è distribuita<br />

come una 2<br />

2<br />

con n k gradi di libertà, mentre W / ha distribuzione 2<br />

con k 1 gradi di<br />

libertà; inoltre V e W sono tra loro indipendenti. Quindi il rapporto<br />

W /( k1)<br />

F <br />

V /( nk) ha distribuzione di Fisher con 1 k1, 2 n k gradi di libertà. Se W è troppo grande<br />

dovremmo rifiutare H 0 ; fissando un livello di significatività del test pari ad , ovvero fissando la<br />

probabilità di commettere l’errore di tipo I rifiutando H0 quando è vera, dalle tavole della<br />

distribuzione F 1, si ricava il percentile F<br />

2<br />

per cui se<br />

F F si rifiuta H0 prendendo la decisione giusta nell’ (1 )% dei casi. Il terst appena anlizzato prende<br />

comunemente il nome di F-test.<br />

L’analisi svolta viene normalmente riportata su una tabella che viene detta appunto tabella<br />

dell’analisi della varianza<br />

variazione gradi di libertà<br />

somme<br />

quadrati<br />

dei<br />

devianze statistiche<br />

Tra gruppi<br />

Nei gruppi<br />

k-1<br />

n-k<br />

W<br />

V<br />

W/(k-1)<br />

V/(n-k)<br />

W /( k1)<br />

;<br />

V /( nk) Totale n-1 T<br />

z ln F<br />

che nel nostro caso diventa<br />

2


52<br />

variazione gradi di libertà<br />

Somme<br />

quadrati<br />

dei<br />

devianze statistiche<br />

Tra gruppi<br />

Nei gruppi<br />

Totale<br />

3<br />

36<br />

39<br />

2620<br />

6496<br />

9116<br />

873.33<br />

183.22<br />

F = 4.84;<br />

z = 0.79<br />

Se si sceglie 0.05 dalle tavole si ricava F 2.90 ; per cui dato che 4.84>2.90 dobbiamo<br />

rifiutare l’ipotesi che la differenza tra le medie degli scambi giornalieri dei 4 prodotti finanziari sia<br />

dovuta al caso.<br />

Lo stesso tipo di analisi può essere condotta se la misura della grandezza di interesse x è<br />

influenzata da più di un attributo. In riferimento al caso già trattato supponiamo di considerare il<br />

( )<br />

numero di scambi giornalieri di k titoli in h mercati; per cui ora xij denota la -esima rilevazione<br />

del numero di scambi giornalieri del titolo i -esimo nel mercato j -esimo.<br />

Ora, il generico dato può essere rappresentato nel seguente modo<br />

( ) ( )<br />

ij i j ij ij<br />

x a b y<br />

Senza perdita di generalità, per semplificare le notazioni, si assume che ciascuna classe sia<br />

composta dallo stesso numero di elementi, per cui 1 m per ogni i, j. La costante ij modella<br />

l'effetto combinato dei due attributi, e la variabile<br />

dato e si assume con distribuzione<br />

Siano ora<br />

2<br />

N(0, ) .<br />

( )<br />

yij modella al solito la variabilità statistica del<br />

1 h m<br />

( ) 1 h m<br />

( ) 1 m<br />

( )<br />

i,.,. xij , ., j,. xij , ij xij<br />

hm j11 km i11<br />

m1<br />

ˆ ˆ ˆ <br />

la media dei dati per il valore i-esimo del primo attributo, la media dei dati per il valore j-esimo del<br />

secondo attributo, la media dei dati all'interno di ciascun gruppo individuato dalla generica coppia<br />

di valori i, j del primo e del secondo attributo. La variabilità totale T dei dati può essere questa<br />

volta decomposta nel seguente modo<br />

( ) ( )<br />

2<br />

xij ˆ xij ˆ ij hm ˆ i,.,. ˆ km ˆ ., j,.<br />

ˆ <br />

k h m 2 k h m 2 k h<br />

2<br />

<br />

i1 j11 i1 j11 i1 j1<br />

k h<br />

2<br />

m ˆ ij ˆ i,.,. ˆ ., j,. ˆ <br />

V W1W2WI i1 j1<br />

Il primo termine a secondo membro V rappresenta la variabilità statistica dei dati all'interno di<br />

ciascun gruppo ed è indipendente dalla presenza degli effetti degli attributi; esso costituisce il


termine di errore. Il secondo termine W 1 ed il terzo W 2 rappresentano la variabilità dovuta<br />

all'effetto del primo attributo ed all'effetto del secondo attributo, rispettivamente. Il termine<br />

W viene detto interazione e quantifica l'effetto legato alla sinergia degli attributi. L'ipotesi nulla<br />

I<br />

H richiede che tutte le costanti a , b , siano nulle. Se questo è vero, con l'ipotesi di gaussianità<br />

0<br />

i j ij<br />

dei dati, si ha al solito che T / è distribuita come una<br />

2<br />

2<br />

con 1<br />

V<br />

2<br />

W1 2<br />

W2 2<br />

W<br />

2<br />

53<br />

khm gradi di libertà. Si può<br />

quindi applicare il teorema di Cochran ed affermare che , , , I sono<br />

2<br />

variabili aleatorie indipendenti con distribuzione con gradi di libertà khm 1,<br />

k 1,<br />

h 1<br />

e k1h 1<br />

rispettivamente. A questo punto si possono testare varie ipotesi: se si vuole valutare<br />

l'importanza del primo attributo si considera la variabile<br />

<br />

<br />

W1/ k 1<br />

F1<br />

<br />

V / kh m 1<br />

che risulta avere distribuzione di Fisher con k 1, khm 1<br />

gradi di libertà. Fissando al solito il<br />

livello % di significatività del test è possibile rilevare sulle tabelle opportune il relativo percentile<br />

F1, ; se il valore F 1 ottenuto dai dati dell'esperimento supera F1, si deve ritenere che l'effetto del<br />

primo attributo introduce una variabilità sistematica nei dati, non attribuibile a cause aleatorie, e<br />

quindi ha senso stratificare i dati in base ai valori del primo attributo. Lo stesso ragionamento vale<br />

per il secondo attributo; si consideri la variabile<br />

F<br />

2<br />

<br />

<br />

W2/ h 1<br />

<br />

V / kh m 1<br />

che ha distribuzione di Fisher con h 1, khm 1<br />

gradi di libertà. Si scelga il livello % di<br />

significatività del test e si determini il percentile F2, dalle tabelle. I valori del secondo attributo<br />

inducono una stratificazione significativa dei dati se F2 F2, .<br />

Infine il grado di interazione fra gli attributi può essere valutato considerando la variabile<br />

F<br />

I<br />

<br />

/ 1<br />

WI/ k 1 h 1<br />

<br />

V kh m<br />

che ha distribuzione di Fisher con k 1h 1 , khm 1<br />

gradi di libertà. Scelto il livello % di<br />

significatività del test e determinato il percentile FI , dalle tabelle, se risulta FI FI, dovremo<br />

ritenere che l'effetto combinato dei due attributi è significativo ai fini di una stratificazione della<br />

popolazione. La popolazione risulta essere omogenea se in tutti e tre i test precedenti le statistiche<br />

F, F e F I ottenute dai dati non superano i rispettivi percentili.<br />

1 2<br />

Nel caso particolare in cui m 1,<br />

per cui è disponibile una sola rilevazione xij della variabile x per<br />

ogni coppia di valori (, i j) dei due attributi, non è possibile modellare il grado di interazione tra gli<br />

attributi. Per cui si avrà la seguente rappresentazione del dato generico


54<br />

xij aibj yij<br />

dove, nelle stesse ipotesi del caso con interazione, ai è una costante che tiene conto dell’effetto<br />

dell’attributo “titolo”, bj è una costante che tiene conto dell’effetto dell’attributo “mercato”, e<br />

ij<br />

2 0 y N , . In questa situazione le grandezze<br />

h k k h<br />

1 1 1<br />

i,. x ij , ., j x ij , xij<br />

h j1 k i1 hk i1 j1<br />

ˆ ˆ ˆ <br />

denotano la media degli scambi giornalieri del titolo i -esimo sull’insieme dei mercati, la media<br />

degli scambi giornalieri dell’insieme di titoli nel mercato j -esimo e la media degli scambi<br />

giornalieri di titoli sull’insieme dei mercati, rispettivamente.<br />

La variabilità totale dei dati risulterà quindi ripartita nel seguente modo<br />

2<br />

xij ˆ ˆ i,. ˆ ˆ ., j ˆ xij ˆ i,. ˆ ., j ˆ <br />

k h 2 k h k h 2 k h<br />

2<br />

<br />

i1 j1 i1 j1 i1 j1 i1 j1<br />

k h 2 k h<br />

2<br />

2<br />

i,. ˆ ˆ ., j ˆ ij ˆ i,. ˆ ., j ˆ <br />

<br />

h k x <br />

i1 j1 i1 j1<br />

W W V<br />

1 2<br />

Il primo termine a secondo membro è la variabilità tra i vari titoli, il secondo è la variabilità tra i<br />

mercati, ed il terzo termine è detto comunemente termine di errore. Con ragionamenti analoghi al<br />

caso precedente, a norma del teorema di Cochran, possiamo affermare che i tre termini a secondo<br />

2<br />

2<br />

membro sono indipendenti; inoltre W è distribuita come una con k 1gradi<br />

di libertà,<br />

2<br />

2<br />

1<br />

2<br />

con<br />

W2 è distribuita come una con h 1<br />

gradi di libertà e V è distribuita come una<br />

h1k 1<br />

gradi di libertà.<br />

A questo punto possiamo testare varie ipotesi; per esempio se vogliamo testare se l’effetto della<br />

variabilità dovuta ai titoli è significativo basta considerare la variabile<br />

1 / 1<br />

1 1<br />

W k<br />

F1 <br />

V / h k<br />

che sarà distribuita come una Fisher F k1, h1k1. Se invece vogliamo testare per la significatività<br />

dell’effetto legato ai mercati possiamo considerare la variabile<br />

F<br />

2<br />

2 / 1<br />

1 1<br />

W h<br />

<br />

V / h k


che sarà distribuita come una Fisher F h1, h1k1. adhf primer method<br />

1 4.0 1 D<br />

2 4.5 1 D<br />

3 4.3 1 D<br />

4 5.6 2 D<br />

5 4.9 2 D<br />

6 5.4 2 D<br />

7 3.8 3 D<br />

8 3.7 3 D<br />

9 4.0 3 D<br />

10 5.4 1 S<br />

11 4.9 1 S<br />

12 5.6 1 S<br />

13 5.8 2 S<br />

14 6.1 2 S<br />

15 6.3 2 S<br />

16 5.5 3 S<br />

17 5.0 3 S<br />

18 5.0 3 S<br />

<br />

Esaminiamo il seguente caso. Tre tipi di fondo per vernici<br />

(primer) sono applicatio su alluminio in due modi: immersione<br />

(dipping, D), a spruzzo (spraying, S). L'esperimento consiste nel<br />

determinare la forza di adesione della vernice (adhf)<br />

dipendentemente dal fondo e dal metodo utilizzati. In base ai<br />

valori della tabella valutiamo se la forza di adesione risente<br />

singolarmente del primer e del metodo di applicazione, o risente<br />

del loro effetto combinato. I dati dell'esperimento sono riportati<br />

nella tabella accanto: si ha un totale di 18 misure: per ogni primer<br />

si hanno tre ripetute per il metodo dipping e tre ripetute per lo<br />

spraying. La forza di aderenza della vernice dipende da due<br />

attributi : il "metodo di deposizione del primer", attributo con<br />

k 2 valori "D" e "S"; il "tipo di primer " con h 3 valori "tipo<br />

1", "tipo 2" e "tipo 3". Gli attributi determinano un totale di<br />

k* h 6 gruppi, ciascuno con m 3 ripetute<br />

Probability<br />

notiamo in effetti che la media dei 0.10<br />

dati<br />

0.05<br />

0.02<br />

Normal Probability Plot<br />

( )<br />

xij , i 1,2 j 1,2,3 1,2,3<br />

0.98<br />

Verifichiamo l'applicabilità del test 0.95<br />

ANOVA a 2 vie descritto. Il valor 0.90<br />

medio campionario dei dati è pari a<br />

4.9889, mentre la deviazione 0.75<br />

standard stimata, nell'ipotesi che il<br />

campione sia casuale, è pari a 0.50<br />

0.2070. I dati sono valori positivi, ci<br />

chiediamo quanto sia verosimile 0.25<br />

testare un'ipotesi di gaussianità:<br />

dista dallo 0 per più di 4, per la<br />

distribuzione gaussiana può essere un<br />

buon modello di distribuzione dei dati, in<br />

4 4.5 5<br />

Data<br />

5.5 6<br />

quanto prevede che l'insieme dei valori negativi ha una probabilità di occorrere<br />

inferiore a 0.006. Analizziamo il Q-Q plot. Dalla figura accanto si nota un certo allineamento tra i<br />

quantili: il test di Lilliefors (Matlab) suggerisce che il rifiuto dell'ipotesi nulla che la distribuzione<br />

dei dati sia gaussiana ha un rischio (p_value) pari a 0.4233>>0.05, per cui l'ipotesi nulla va<br />

accettata, ed i dati sono ritenersi estratti da una distribuzione gaussiana. Verifichiamo ora<br />

l'omoschedasticità dei dati (ipotesi nulla): il test di Bartlett garantisce che non ci sia differenza<br />

significativa tra le varianze dei gruppi, con un p_value pari a 0.9214. Siamo quindi nelle condizioni<br />

di applicazione del test ANOVA di Pearson.<br />

Ripartiamo quindi la variabilità totale dei dati nel modo visto<br />

( ) ( )<br />

2<br />

ij ˆ ij ˆ ij 9 ˆ i,.,. ˆ 6 ˆ ., j,.<br />

ˆ <br />

2 3 3 2 2 3 3 2 2 3<br />

2<br />

<br />

T x x <br />

i1 j11 i1 j11 i1 j1<br />

2 3 2<br />

3 ˆ ij ˆ i,.,. ˆ ., j,. ˆ <br />

V W1W2WI i1 j1<br />

55


56<br />

1 3 3 3 3<br />

( ) 1 ( )<br />

1,.,. 1j 2,.,. 2j<br />

9 j11 9 j11<br />

ˆ x 4.4667, ˆ x 5.5111<br />

methods<br />

1 2 3 2 3 2 3<br />

( ) 1 ( ) 1 ( )<br />

.,1,. i1 .,2,. i2 .,3,. i3<br />

6 i11 6 i11 6 i11<br />

ˆ x 4.7833, ˆ x 5.6833 ˆ x 4.5<br />

primers<br />

11<br />

1 3<br />

( ) x11 31 12<br />

1 3<br />

( ) x12 31 13<br />

1 3<br />

( )<br />

x13<br />

31<br />

21<br />

1 3<br />

( ) x21 31 22<br />

1 3<br />

( ) x22 31 23<br />

1 3<br />

( )<br />

x23<br />

31<br />

ˆ 4.2667, ˆ 5.3, ˆ 3.8333,<br />

ˆ 5.3, ˆ 6.0667 ˆ 5.1667<br />

2 3 3<br />

( )<br />

xij<br />

i1 j11<br />

1<br />

4.9889<br />

18<br />

Si ottiene<br />

T 10.7178, V 0.9867, W14.9089, W24.5811, WI 0.2411<br />

I dati sono gaussiani e omoschedastici, per cui sotto l'ipotesi nulla<br />

H : a a 0, b b 0, 0<br />

0 1 2 1 2 11 12 21 22<br />

T<br />

2<br />

ha distribuzione 17 ; il teroema di Cochran assicura quindi che le variabili<br />

la variabile 2<br />

<br />

VW , 1, W2, WI sono<br />

2<br />

tra loro indipendenti, con gradi di libertà rispettivamente pari a 12,1,2,2.<br />

A questo punto calcoliamo le statistiche del test per la significatività dell'attributo "metodo di<br />

deposizione"<br />

dell'attributo "tipo di primer"<br />

e dell'interazione fra i due attributi<br />

W1<br />

F1<br />

59.7027<br />

V /12<br />

W 2/2<br />

F2<br />

27.8581<br />

V /12<br />

WI /2<br />

FI 1.4662<br />

V /12<br />

Fissando il livello di significatività del test pari a % 0.05,<br />

dalle tabelle della Fisher otteniamo il<br />

percentile per la F 1,12 pari a 4.75, per cui si può ritenere che il metodo di deposizione del fondo<br />

costituisca un attributo che influenza significativamente la forza di aderenza della vernice; dai


valori medi calcolati per methods si vede subito che il secondo metodo (spraying) determina una<br />

forza media (sui tre tipi di primer) di aderenza pari a 5.5111 contro 4.4667 del primo metodo<br />

(dipping). Invece il percentile per la F 2,12 pari a 3.88, per cui anche l'attributo "tipo di primer"<br />

influenza significativamente la forza di aderenza: dai valori medi calcolati per primers si nota come<br />

il secondo tipo di fondo garantisca una forza di aderenza media (sui due metodi di deposizione) pari<br />

a 5.6833, significativamente più alta rispetto agli altri due tipi di fondo, che hanno prestazioni simili<br />

di 4.7833 (tipo 1) e 4.5 (tipo 3). Questa considerazione comunque andrebbe confortata con una<br />

ulteriore analisi ponendo i dati relativi al tipo1 e tipo 3 in un unico gruppo e verificare la differenza<br />

significativa con il gruppo di dati relativi al tipo 2. Per quanto riguarda l'interazione, dato che il<br />

percentile è lo stesso che per F2, si vede come si debba escludere una sinergia tra metodo di<br />

deposizione del fondo e tipo di fondo.<br />

Per quanto riguarda la significatività dei due attributi singolarmente, avremmo potuto anche<br />

utilizzare due ANOVA ad una via. Ad esempio, per l'attributo "metodo di deposizione", avremmo<br />

raggruppato i dati in due classi: la prima per il valore "dipping" dell'attributo, aggregando i 9 dati in<br />

tabella contrassegnati con "D", relativi ai tre tipi di primer; la seconda classe relativa al valore<br />

"sparying" dell'attributo, aggregando i 9 dati in tabella contrassegnati con "S". In questo caso si<br />

sarebbe ottenuta la seguente ripartizione della variabilità dei dati<br />

( ) ( )<br />

ij ˆ ij ˆ i 9<br />

ˆ i ˆ <br />

2 3 3 2 2 3 3 2 2<br />

2<br />

<br />

T x x V W<br />

i1 j11 i1 j11 i1<br />

dove è lo stesso di prima in quanto è la media globale dei dati, mentre<br />

1 3 3 3 3<br />

( ) 1 ( )<br />

1 x1j 4.4667 1,.,. , 2 x2j<br />

5.5111 2,.,.<br />

9 j11 9 j11<br />

<br />

Si ottiene<br />

T10.7178, V 5.8089, W 4.9089<br />

Si noti come il termine W è lo stesso del termine W 1 dell'ANOVA a due vie con interazione,<br />

mentre il termine d'errore V raccolga la somma dei termini VW , 2, WI(salvo approssimazioni<br />

numeriche) della precedente analisi.<br />

Nelle stesse ipotesi statistiche abbiamo che la variabile<br />

W<br />

F 13.521<br />

V /16<br />

ha distribuzione Fisher F 1,16 il cui percentile del 5% è compreso tra 4.54 e 4.35. Per cui si deve<br />

rifiutare l'ipotesi nulla e ritenere il metodo di deposizione un fattore significativo per la forza di<br />

aderenza della vernice. Inoltre, avendo solo due gruppi, risulta immediatamente che il secondo<br />

metodo, lo spraying, ha le prestazioni migliori, garantendo una forza di adesione media (su tutti i<br />

primer) di 5.5111 contro 4.4667 del metodo dipping. Tale risultato conferma quanto ottenuto<br />

nell'ANOVA a due vie. Sulla scorta di questa osservazione eseguiamo ora un ANOVA ad una via<br />

per l'attributo "tipo di primer". Si ottengono tre classi, ognuna di 6 dati ottenuti considerando per<br />

ogni primer le 3 ripetute contrassegnate con "D" e le 3 contrassegnate con "S". Si ottiene<br />

57


58<br />

( ) ( )<br />

ij ˆ ij ˆ i 6<br />

ˆ i ˆ <br />

2 3 3 2 2 3 3 2 3<br />

2<br />

<br />

T x x V W<br />

con<br />

i1 j11 i1 j11 i1<br />

1 2 3 2 3 2 3<br />

( ) 1 ( ) 1 ( )<br />

1 xi1 4.7833 .,1,. , 2 xi2 5.6833 .,2,. , 3 xi3<br />

4.5 .,3,.<br />

6 i11 6 i11 6 i11<br />

<br />

Si ottengono quindi i seguenti valori<br />

T 10.7178, V 6.1367, W 4.5811<br />

Possiamo anche qui notare che W W2,<br />

mentre V raccoglie i termini VW , 1, WIdell'ANOVA a due<br />

vie. Osserviamo che il termine di differenza tra gruppi questa volta è più piccolo che nel caso<br />

precedente per l'attributo "metodo di deposizione ", mentre la V è più grande. Infatti risulta<br />

W /2<br />

F2<br />

5.5989<br />

V<br />

15<br />

che comunque è maggiore del percentile del 5% di una Fisher F2,15 3.68 . Per cui anche l'effetto<br />

dell'attributo " tipo di primer" è da ritenersi significativo. Tuttavia, rispetto al caso precedente, ora<br />

ci sono tre gruppi e non è chiaro come scegliere il primer migliore, in quanto il rifiuto dell'ipotesi<br />

nulla dice solo che c'è almeno un gruppo significativamente differente dagli altri. Per cui bisogna<br />

condurre un'analisi ulteriore, come si era peraltro già precisato in occasione dell'analisi ANOVA a 2<br />

vie.<br />

Analizziamo ora il caso di studio togliendo la variabilità dei dati dovuta alle tre ripetute per<br />

ogni gruppo: questo si ottiene sostituendo alle 3 ripetute la loro media ij, i 1,2 j 1,2,3.<br />

Otteniamo quindi uno schema di analisi ANOVA a 2 vie senza interazione<br />

2<br />

ˆ ij ˆ 3 ˆ i,. ˆ 2 ˆ .,jˆ ˆ ijˆ i,. ˆ .,jˆ <br />

2 3 2 2 3 2 2 3<br />

2<br />

<br />

T <br />

dove<br />

i1 j1 i1 j1 i1 j1<br />

W W V<br />

1 2<br />

1 3 1 3<br />

1,. 1j 2,. 2j<br />

3 j1 3 j1<br />

ˆ ˆ 4. 4667, ˆ ˆ 5.<br />

5111<br />

1 2 1 2 1 2<br />

., 1 i 1 ., 2 i 2 ., 3 i3<br />

2 i1 2 i1 2 i1<br />

ˆ 4. 7833, ˆ 5. 6833, ˆ ˆ 4.<br />

5<br />

Quindi si ottiene<br />

T 3.2427, V 0.0804, W 1.6363, W <br />

1.5270<br />

1 2


Notiamo subito che la variabilità totale è diminuita rispetto ai casi precedenti in quanto questa è<br />

dovuta solo alle "medie delle misure in ciascun gruppo" ij e non dalle misure<br />

precedenti. Nelle stesse ipotesi statistiche dei casi precedenti abbiamo che le variabili<br />

59<br />

( )<br />

xij , come nei casi<br />

W1 W2<br />

/2<br />

F1 40.7189, F2<br />

19<br />

V /2 V /2<br />

hanno distribuzione di Fisher F 1,2 con percentile del 5% pari 18.51, e F 2,2 con percentile del<br />

5% pari 19. Per cui, mentre per il primo l'attributo "metodo di deposizione" otteniamo dei risultati<br />

in accordo con quelli delle analisi precedenti, in quanto l'ipotesi nulla deve essere rifiutata, per il<br />

secondo attributo "tipo di primer" la situazione è un pò critica: si ottiene un valore di F2 proprio pari<br />

al percentile F2,2,0.05 19 (in effetti sarebbe F2 19.000000000000142 ). A questo punto siamo<br />

proprio sulla frontiera del set critico, potremmo senz'altro decidere comunque di rifiutare l'ipotesi<br />

nulla; sarebbe comunque più ragionevole ad esempio richiedere l'acquisizione di dati ulteriori. Ma,<br />

indipendentemente dalla decisione che prenderemo, notiamo come l'aver mediato le misure<br />

riducendo la variabilità totale dei dati abbia portato ad una situazione di indecisione. Avremmo<br />

anche potuto avere un risultato per cui, nel caso del secondo attributo, avremmo dovuto accettare<br />

l'ipotesi nulla, ottenendo un'indicazione in netto contrasto con quella delle analisi precedenti.<br />

Questo semplice caso di studio su dati reali ha mostrato che è meglio usare un modello per i<br />

dati in cui i due (o più) attributi vengono considerati contemporaneamente, conviene quindi sempre<br />

rappresentare al meglio tutte le cause di variabilità dei dati.


60<br />

Concludiamo la sezione dell'ANOVA riassumendo e discutendo le ipotesi che devono essere<br />

soddisfatte dall'insieme dei dati affinché l'F-test dia risultati attendibili<br />

1. ciascun gruppo dell'insieme deve essere un campione di dati casuale, e i dati relativi a<br />

gruppi differenti devono essere indipendenti<br />

2. i gruppi devono avere grosso modo lo stesso numero di dati<br />

3. la scala di variazione dei dati deve essere comparabile tra i diversi gruppi<br />

4. la distribuzione dei dati deve essere gaussiana<br />

5. la varianza deve essere costante<br />

Diciamo subito che l'F-test è robusto rispetto a violazioni delle condizione 4) e 5) se ogni gruppo<br />

ha un numero di dati sufficientemente grande e più o meno uguale tra loro. In caso di numero di dati<br />

basso, le differenze tra le varianze può risultare determinante.<br />

K-W ANOVA. L'algoritmo di Kruskal-Wallis è un test ANOVA non parametrico che si può<br />

applicare tutte le volte che la distribuzione dei dati differisca significativamente dalla gaussiana, pur<br />

rimanendo la stessa per tutta la popolazione, per cui deve sempre valere l'omoschedasticità. Per<br />

meglio illustrare l'algoritmo consideriamo un esempio.<br />

Un'azienda vinicola chiede a degli intenditori di testare tre dei loro vini, indichiamoli per semplicità<br />

A, B e C, con un punteggio da uno a dieci. Ecco quanto ottenuto dopo i vari assaggi (tabella di<br />

sinistra)<br />

Per prima cosa si devono ordinare i dati in ordine<br />

crescente. Nella tabella quindi ad ogni dato viene<br />

sostituito il suo numero d'ordine nella lista (rank). Se due<br />

o più dati dovessero avere lo stesso valore e quindi<br />

occupare lo stesso rank, questo viene ripartito in parti<br />

uguali in modo da non privilegiare nessun gruppo<br />

(adjusted ranks). Nel caso in esame si ottiene la tabella di<br />

destra.<br />

Ora l'ipotesi nulla consiste nel testare che i valori medi<br />

dei ranghi dei tre gruppi siano uguali, contro l'ipotesi<br />

alternativa che almeno due di essi differiscano. Siano al solito n1, n2, n 3 il numero di dati per<br />

ciascun gruppo, e si indichino con r1, r2, r3<br />

i valori medi dei ranghi nei tre gruppi, mentre sia<br />

la media dei ranghi per tutto l'insieme di dati. La statistica del test è data dalla seguente variabile<br />

r<br />

3<br />

<br />

ˆ ˆ <br />

ni<br />

ri r<br />

i1<br />

H <br />

1<br />

NN 1<br />

12<br />

dove al solito N è il numero totali di dati. Questa risulta essere distribuita approssimativamente<br />

2 2<br />

come una 31 2<br />

(chi-quadro a 2 gradi di libertà ). Il percentile del 5% di tale distribuzione è<br />

pari a 5.991. Per cui il set critico del test di livello 5% è data da<br />

2


H 5.991<br />

Nel caso in esame si ottiene H 9.5591,<br />

per cui si deve rifiutare l'ipotesi nulla e ritenere che i<br />

gruppi abbiano ranghi con medie significativamente differenti; si noti in particolare come i ranghi<br />

corrispondenti al vino A siano più elevati rispetto agli altri due vini, per cui possiamo senz'altro<br />

concludere che il vino A abbia riscosso maggior successo tra gli intenditori.<br />

Il test K-W da buoni risultati se le la distribuzione dei dati ha la stessa forma per tutti i gruppi e le<br />

varianze sono sostanzialmente uguali, già con 5 dati per ogni gruppo. Generalmente si assegna<br />

come regola che la varianza più grande sia non più del doppio della varianza più piccola.<br />

Se tuttavia i dati avessero la stessa distribuzione ma soffrissero di una forte eteroschedasticità, il test<br />

K-W non è affidabile. In caso che la distribuzione sia gaussiana si può ricorrere al seguente test.<br />

Welch ANOVA. Con il solito significato dei simboli, facciamo riferimento ad un insieme di dati con<br />

k gruppi; la distribuzione sia gaussiana ma le varianze dei gruppi differiscano significativamente.<br />

In queste condizioni il valor medio di popolazione si calcoli con la seguente media pesata<br />

k<br />

wi<br />

ˆ i<br />

k<br />

i1ni wi w<br />

2 wi<br />

w sn<br />

i1<br />

ˆ <br />

, , <br />

dove al solito le 2<br />

s n sono le varianze campionarie di ciascun gruppo. La statistica del test è data<br />

i<br />

dalla seguente variabile<br />

k<br />

<br />

i1<br />

w ( ˆ ˆ )<br />

i i<br />

W <br />

k 1<br />

2( k 2) k 1 <br />

w<br />

1 1 i <br />

<br />

2 <br />

<br />

k 1 i1<br />

ni1w <br />

<br />

<br />

che risulta essere distribuita come una chi-quadro con un numero di gradi di libertà dato da<br />

k 1<br />

k 1 w<br />

3 1 i <br />

<br />

<br />

i1<br />

ni1w <br />

<br />

<br />

Come al solito si prende il valore intero più vicino.<br />

2<br />

i<br />

2<br />

2<br />

2<br />

61


62<br />

Piano degli esperimenti<br />

Come abbiamo visto, l’analisi della varianza permette di testare ipotesi composte nella stima<br />

del valor medio di una popolazione. Nel caso quindi che l’ipotesi H0 debba essere rifiutata significa<br />

sostanzialmente che l’insieme di dati non è omogeneo statisticamente; quindi se nella stima del<br />

valor medio di insieme il campione di n dati non venga opportunamente stratificato tra le varie<br />

classi dell’insieme, ne risulterebbe una stima affetta da grande variabilità, e quindi poco affidabile.<br />

Questo può essere facilmente compreso se consideriamo il caso in cui gran parte dei dati del<br />

campione cadano in una sola delle classi; questo darebbe luogo ad una stima del valor medio<br />

d’insieme fortemente polarizzata dalle caratteristiche statistiche della classe suddetta.<br />

Nasce quindi l’esigenza di pianificare l’esperimento in modo da raccogliere i dati<br />

distribuendo opportunamente la numerosità del campione tra le varie classi o strati; questa tecnica<br />

prende il nome di stratificazione (o clusterizzazione). La situazione generale è quindi quella di un<br />

insieme di N elementi suddivisi in k strati ognuno con i N unità. Sia i il valor medio di un certo<br />

attributo degli elementi considerati nella classe i-esima, e sia wi Ni / N il peso della classe i-esima<br />

nell’insieme, che supponiamo noto perché, ad esempio, ottenuto da una precedente indagine<br />

sperimentale condotta ad hoc. Come è facile verificare per il valore medio di insieme si ha<br />

k<br />

wii<br />

i1<br />

Ora consideriamo ni elementi per ogni strato e stimiamo i con la media campionaria ˆ n . Come<br />

i<br />

sappiamo questa è una stima centrata E ˆ <br />

n <br />

i ie,<br />

nel caso realistico di estrazione in blocco<br />

senza reinserzione, con varianza<br />

<br />

2<br />

2 Ni ni<br />

i<br />

ˆ <br />

ni<br />

Ni 1<br />

ni<br />

mentre nel caso sia possibile l’estrazione di un campione indipendente si otterrebbe<br />

2 <br />

ˆ <br />

ni<br />

n<br />

2<br />

dove i è la varianza intraclasse dell’attributo considerato, ed è inferiore alla varianza 2<br />

di<br />

popolazione se, ovviamente, la stratificazione è stata eseguita opportunamente! La stima ˆ n della<br />

media di popolazione è quindi data da<br />

2<br />

i<br />

i<br />

k<br />

ˆn wi<br />

ˆni i1<br />

<br />

che è centrata come è facile verificare; inoltre ritenendo che il campione preso da uno strato sia<br />

indipendente da quelli presi dagli altri, la varianza di ˆ n è data da


k 2<br />

2 i<br />

wi camp. indp.<br />

k i1<br />

ni<br />

2 2 2 <br />

ˆ w<br />

i<br />

n ˆ n<br />

i1 i k<br />

2<br />

2 Ni n<br />

w i i<br />

i<br />

camp. non indp.<br />

i1<br />

Ni 1<br />

ni<br />

<br />

2<br />

dove i può essere a sua volta stimata nei modi indicati.<br />

Come si vede la varianza della stima dipende dagli n i , per cui una corretta scelta di essi può<br />

rendere la stima ˆ n più accurata possibile una volta fissato, per motivi di costi o altri motivi di<br />

ordine pratico, la numerosità totale n del campione. Esaminiamo due possibili strategie!<br />

1) Attribuzione proporzionale<br />

In questo caso si sceglie ni wn i (ovviamente approssimato ad un intero); per la varianza<br />

della stima otteniamo<br />

<br />

1 k<br />

2<br />

wii camp. indp.<br />

n i1<br />

2 <br />

ˆ <br />

<br />

n<br />

<br />

1 k<br />

Ni ni<br />

2<br />

wi i<br />

camp. non indp.<br />

<br />

<br />

ni1Ni1 ed è facile dimostrare che risulta essere minore rispetto a quella ottenibile estraendo un campione<br />

casuale di dimensione n dall’intera popolazione.<br />

2) Attribuzione ottimale<br />

In questo caso si cercano i valori ottimi * ni che rendano minima la varianza<br />

<br />

con il vincolo nin . Mediante la tecnica dei moltiplicatori di Lagrange si ottiene<br />

2<br />

ˆ n<br />

63<br />

della stima,


64<br />

In effetti, nella misura in cui / 1<br />

<br />

<br />

Nii<br />

<br />

n camp. indp.<br />

k<br />

N jj j1<br />

* <br />

ni<br />

<br />

<br />

N<br />

N i<br />

i i<br />

Ni<br />

1<br />

n<br />

camp. non indp.<br />

k<br />

N j<br />

N j j<br />

j1<br />

N j 1<br />

N N 1, si può usare la stessa attribuzione ottima<br />

i i<br />

e la varianza della stima all’ottimo vale<br />

Esempio<br />

<br />

<br />

2<br />

1 k <br />

wii camp. indp.<br />

n <br />

<br />

i1<br />

2 <br />

<br />

ˆ <br />

<br />

n<br />

2<br />

<br />

2 2<br />

1 k N k<br />

i w<br />

w ii ii <br />

camp. non indp.<br />

n <br />

i1 Ni 1 <br />

i1Ni<br />

1<br />

Si vuole stimare il consumo medio giornaliero di pane in un’azienda di N 10.000 dipendenti. Se<br />

si ricorresse ad un campione casuale di n 1000 dipendenti, supponendo una varianza di<br />

2<br />

popolazione 9 , la stima campionaria ˆ n della media avrebbe varianza<br />

2<br />

2 <br />

ˆ n<br />

n<br />

9<br />

0.009<br />

1000<br />

Tendendo conto delle varie tipologie di dipendenti, si può pensare alla seguente stratificazione<br />

i strato i<br />

N i<br />

w i<br />

1 manovali 6.500 0.650 1<br />

2 operai specializzati 2.500 0.250 1.5<br />

3 impiegati 920 0.092 2<br />

4 dirigenti 80 0.008 2.5<br />

totale 10.000 1.00


Nell’ipotesi che il campionamento interclasse sia indipendente, nel caso di attribuzione<br />

proporzionale si ottiene<br />

2 2 2 2<br />

2 (0.65)1 (0.25)1.5 (0.092)2 (0.008)2.5<br />

1.6305<br />

ˆ <br />

n<br />

n n<br />

Volendo mantenere la stessa accuratezza della stima ottenuta con il campione casuale si pone<br />

1.6305<br />

0.009<br />

n<br />

da cui si ricava n 190 anziché 1000 come prima, ottenendo quindi un forte risparmio in termini di<br />

numero di rilevamenti da effettuare. L’attribuzione proporzionale sarebbe la seguente<br />

i ni<br />

1 124<br />

2 47<br />

3 17<br />

4 2<br />

totale 190<br />

Fissando definitivamente n 190 e scegliendo l’attribuzione ottima<br />

otterremmo la seguente varianza della stima<br />

i<br />

*<br />

n i<br />

1 98<br />

2 57<br />

3 29<br />

4 6<br />

totale 190<br />

2<br />

1<br />

(0.65)1 (0.25)1.5 (0.092)2 (0.008)2.5 0.00794<br />

190<br />

2<br />

ˆ <br />

<br />

n<br />

che è sensibilmente inferiore a quella ottenuta con l’attribuzione proporzionale.<br />

Svolgiamo ora la nostra indagine circa il consumo medio giornaliero di pane sulla base di un<br />

campione di 190 unità come indicato dalla nostra analisi preliminare. I dati sono N 10.000 , i<br />

valori di i N e i w della tabella precedente, ed i valori ottimi * n i appena determinati. Prelevando<br />

quindi il campione secondo la modalità prestabilita e calcolando medie e varianze campionarie si è<br />

ottenuto<br />

65


66<br />

i<br />

ˆ ni<br />

*<br />

ni<br />

n s<br />

i,1 * ni<br />

ni<br />

1<br />

ˆ <br />

1 4.3 1.2<br />

2 3.5 1.6<br />

3 2.0 2.1<br />

4 1.5 2.3<br />

Per il consumo medio giornaliero di pane per l’azienda considerata si ottiene<br />

4<br />

n wi<br />

ni<br />

i1<br />

ˆ ˆ 0.654.3 0.253.5 0.09220.0081.5 3.866<br />

La stima della varianza, con le stime delle varianze intraclasse, risulta<br />

2<br />

2 1<br />

ˆ ˆ 0.651.2 0.251.6 0.0922.10.0082.3 0.0102<br />

n<br />

190<br />

che da luogo ad una deviazione standard di 0.1010 ed un coefficiente di variazione<br />

ˆ ˆ n<br />

0.1010<br />

<br />

ˆ n 3.866<br />

denotando una stima molto precisa della media!<br />

<br />

0.026 2.6%

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!