Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
2. Statistica <strong>induttiva</strong><br />
Abbiamo visto come per mezzo della statistica descrittiva sia possibile ottenere una<br />
descrizione sintetica di dati sperimentali riguardanti un determinato processo; questa è finalizzata<br />
alla rappresentazione dell’informazione utile agli scopi fissati per la definizione di opportune<br />
strategie di intervento. Tuttavia, riprendendo l’esempio trattato, abbiamo visto come i parametri<br />
descrittivi venivano dedotti dalla distribuzione campionaria o empirica, ovvero il loro valore era<br />
legato strettamente ai valori dei dati ottenuti nel particolare esperimento eseguito; ripetendo<br />
l’esperimento, cioè prelevando un altro campione di N 100 supporti di ferro, determinando sul<br />
, non necessariamente rispetto agli stessi<br />
nuovo campione di dati la distribuzione campionaria i<br />
sottoinsiemi E i<br />
, ricalcolando i parametri statistici<br />
, , d, c,<br />
otterremmo dei valori diversi da<br />
quelli relativi al primo insieme di dati! Questa variabilità dipende in primo luogo dalla numerosità<br />
del campione analizzato e poi dalla sua significatività, ovvero da quanto debba ritenersi<br />
rappresentativo di tutta la produzione. E’ facile comprendere come un campione molto numeroso<br />
consenta di definire un istogramma più preciso della distribuzione effettiva e quindi un calcolo più<br />
attendibile delle varie medie; tuttavia se la nostra fabbrica di supporti in ferro si servisse da due<br />
diversi fornitori di materie prime, ed il nostro campione di dati, ancorché numeroso, avesse<br />
riguardato le unità prodotte con materie prime prese solo da uno dei due fornitori, avremmo<br />
ottenuto una parziale descrizione delle caratteristiche del processo di produzione, non considerando<br />
le caratteristiche dei prodotti ottenuti con lo stesso processo ma con materie prime di altra<br />
provenienza.<br />
La statistica <strong>induttiva</strong> si propone di fornire procedure sistematiche per la verifica della<br />
significatività di un campione di dati in termini sia di scelta della numerosità che di<br />
rappresentatività dell’intera popolazione! Possiamo grosso modo distinguere i seguenti argomenti<br />
Stima puntuale: consiste nel determinare dai dati il valore di un parametro e nel valutare<br />
l’attendibilità della stima<br />
Stima di intervallo: si vuole determinare un intervallo di valori entro il quale possa cadere<br />
con buona probabilità il valore di un parametro incognito<br />
Criteri di verifica delle ipotesi: scelta sistematica tra possibili valori di un parametro quello<br />
più verosimile sulla base dell’evidenza sperimentale<br />
Analisi della varianza: per verificare ipotesi complesse<br />
Programmazione degli esperimenti: tecniche di campionamento e di scelta della<br />
numerosità del campione.<br />
Stima puntuale del valore medio e della varianza<br />
Consideriamo un insieme di N unità e sia X una v.a. che rappresenta i valori di una<br />
determinata qualità degli elementi dell’insieme (il carico di rottura dei supporti in ferro, il<br />
coefficiente del transistor, il rendimento annuo di un prodotto finanziario, la percentuale di<br />
sostanze inquinanti in un campione di acqua, ecc.), che quindi assume i valori x i N<br />
. Come è noto il valor medio e la varianza di X sono definiti nel seguente modo<br />
2<br />
i<br />
27<br />
, 1, , , su
28<br />
2<br />
1 N<br />
2 1 N<br />
xi, xi<br />
<br />
N i1 N i1<br />
ma, non potendo analizzare tutto l’insieme , risultano di valore incognito.<br />
Estraiamo ora dall’insieme un campione casuale di nN elementi e valutiamo la media<br />
campionaria su questo sottoinsieme di dati<br />
ˆ <br />
n<br />
1<br />
n x j<br />
n j1<br />
Ci chiediamo, quanto il valore ˆ n sia vicino o meno al valore medio di popolazione ; in altre<br />
parole possiamo dire che ˆ n è una buona stima di ? Quali caratteristiche di ˆ n dovremmo<br />
osservare per validare o meno questa affermazione?<br />
Come al solito dovremo considerare le cose da un punto di vista statistico. Infatti la<br />
grandezza ˆ n è di natura aleatoria in quanto scegliendo a caso da un qualunque altro campione<br />
di dimensione n , otterremmo un valore ˆ n differente dal precedente, e così via per ogni scelta del<br />
campione. La stima sarà buona se la distribuzione dei valori di ˆ n si localizza sul valore vero e<br />
se i valori sono tutti addensati intorno a . In altre parole stiamo richiedendo che<br />
2<br />
ˆ , ˆ <br />
2<br />
E n ˆ E <br />
n<br />
n <br />
piccola<br />
<br />
cioè che la media E ˆ n della stima di valor medio coincida con il valore vero , e che la<br />
varianza della stima sia piccola. Calcoliamo quindi queste grandezze<br />
1 n 1 n 1<br />
E ˆ nE xj Exj n<br />
<br />
n j1 n<br />
<br />
<br />
<br />
<br />
<br />
<br />
j1<br />
n<br />
dove nel penultimo passaggio si è considerato che il generico valore x j deriva da una popolazione<br />
con valore medio . Il primo requisito è rispettato; in questi casi si dice che la stima non è distorta,<br />
vale a dire che mediamente non si commettono errori nel determinare il valore della grandezza<br />
incognita . Se questo non fosse stato il caso, i.e. E ˆ n , avrebbe significato che il nostro<br />
metodo di stima sarebbe stato affetto da un errore sistematico (uno strumento starato).<br />
Il calcolo della varianza è un po’ più elaborato perché dipende da come è estratto il<br />
campione; se gli elementi del campione sono scelti in maniera indipendente uno dall’altro si ha<br />
2<br />
2 1n <br />
n j <br />
j1<br />
ˆ <br />
2<br />
ˆ E E<br />
x <br />
n <br />
n
2 2<br />
2 1 n 1 n 1 n n<br />
<br />
ˆ E x ( )<br />
2 2 <br />
n j E xj E<br />
xi xj<br />
<br />
nj1 n j1 <br />
<br />
n i1 j1<br />
<br />
<br />
<br />
<br />
2<br />
1 n 2 n n<br />
1 2 <br />
<br />
2 Exj <br />
Exi xj n<br />
2<br />
n j1 <br />
i1 j1 <br />
n n<br />
ji <br />
dove, per l’indipendenza degli elementi, si ha che la covarianza<br />
0<br />
E x x E x E x <br />
<br />
<br />
i j i j<br />
ij Se invece gli elementi del campione non sono indipendenti si ha<br />
2 2<br />
2 1 n 1 n 1 n n<br />
<br />
ˆ E x ( )<br />
2 2 <br />
n j E xj E<br />
xi xj<br />
<br />
nj1 n j1 <br />
<br />
n i1 j1<br />
<br />
<br />
<br />
2<br />
1 n 2 n n<br />
2 n <br />
2 Exj <br />
Exi xj 2<br />
n j1 <br />
i1 j1 <br />
n<br />
<br />
n 2<br />
<br />
<br />
ji <br />
Ora se scegliessimo n N avremmo ˆ n con varianza nulla, per cui<br />
da cui<br />
2 2 2<br />
2 N N 1<br />
<br />
0 <br />
2<br />
N N<br />
<br />
2<br />
<br />
N N N 1<br />
<br />
2<br />
ˆ n<br />
2 2 2<br />
n1 n1<br />
1 <br />
n n N 1 N 1<br />
n<br />
<br />
In entrambi i casi si vede come aumentando n si ottenga una diminuzione di<br />
29<br />
2<br />
ˆn e quindi un<br />
aumento della precisione della stima!<br />
Tuttavia, se dal problema ci fosse richiesto di determinare il minimo valore di n per<br />
assicurare che la precisione della stima non scenda sotto un minimo assegnato, per cui la varianza
30<br />
della stima 2 ˆ non deve superare un limite assegnato, ci troveremmo nella necessità di dover<br />
n<br />
2<br />
della popolazione. Analogamente a quanto è stato fatto per il valor<br />
stimare anche la varianza<br />
medio, potremmo pensare di stimare la varianza campionaria con la seguente espressione<br />
1<br />
s x<br />
n<br />
2<br />
ˆ <br />
2<br />
n<br />
n j n<br />
j1<br />
ma in questo caso si può vedere subito che tale stima sarebbe distorta, cioè presenterebbe un errore<br />
sistematico; infatti, nel caso in cui gli elementi del campione siano scelti in modo indipendente, si<br />
ottiene<br />
2 1 n 2 1 n 2 1 n<br />
2<br />
Es [ n] E <br />
xj ˆ n Exj ˆ n E (<br />
xj<br />
) ( ˆ n )<br />
<br />
n j1 <br />
<br />
n j1 n <br />
<br />
<br />
j1<br />
<br />
1 2 2<br />
<br />
E xj ˆ n 2xj ˆ n <br />
n<br />
n n n<br />
<br />
<br />
<br />
<br />
j1 j1 j1<br />
<br />
1 2 1 1<br />
n n n n n <br />
n<br />
n <br />
<br />
n <br />
n n n<br />
2<br />
2 2 2 2 2 n 2 2<br />
ˆ <br />
2<br />
mentre nel caso che gli elementi non siano scelti in modo indipendente, omettendo i calcoli, si<br />
ottiene<br />
Es [ ]<br />
n1N n N 1<br />
2 2 2<br />
n <br />
Ma la situazione non è così drammatica, infatti basta modificare l’espressione della stima in<br />
modo opportuno per togliere l’errore sistematico. Nel caso di campione indipendente si scelga come<br />
stima campionaria della varianza la seguente espressione<br />
mentre nel secondo caso si scelga<br />
2<br />
n 1<br />
ˆ s x ˆ E ˆ <br />
n1 n1<br />
n<br />
2 2 2 2<br />
n,1 n j n , <br />
<br />
n,1<br />
j1<br />
2<br />
n N 1 N 1 1<br />
<br />
ˆ ˆ ˆ <br />
n1 N N n1 <br />
n<br />
2 2 2 2<br />
n,2 sn xj n , E<br />
<br />
n,2<br />
j1
In entrambi i casi siamo in grado di ottenere quindi una stima centrata della varianza.<br />
Analizziamo ora la varianza della stima. Per il caso di campione indipendente si ha (omettiamo la<br />
dimostrazione)<br />
<br />
4<br />
4 <br />
2 E 2 2 2 X <br />
n 3<br />
2 E ˆ ˆn,1 E[ ˆn,1]<br />
<br />
<br />
<br />
4<br />
n,1<br />
<br />
n n1<br />
<br />
4 4<br />
Ora sappiamo che un valore di riferimento per il rapporto E[( X ) ]/ è 3 ( tale valore occorre<br />
se la distribuzione della v.a. X è gaussiana); per tale valore si ha<br />
2<br />
2 <br />
ˆ n,1 n <br />
4<br />
2<br />
1<br />
per cui il coefficiente di variazione della nostra distribuzione campionaria vale<br />
2<br />
ˆn,1 [ ˆn,1]<br />
2 2 2 2<br />
E E <br />
<br />
<br />
n 1 2<br />
<br />
<br />
<br />
E[<br />
ˆ ]<br />
n 1<br />
2 2<br />
n,1<br />
Per una distribuzione che si vuole piuttosto addensata intorno al valor medio si può<br />
richiedere che il coefficiente di variazione non superi il 20%; per cui<br />
2<br />
0.2 n 51<br />
n 1<br />
Se poi la Curtosi è compresa tra 0 e 2, come nei casi di asimmetria, si ricava n 100 . Se<br />
invece la Curtosi è compresa tra 2 e 20, come nei casi di distribuzione con probabilità non<br />
trascurabile di presentare valori eccezionali (code grasse), si ottiene n 500 .<br />
Se la Curtosi è inferiore a 0 occorre sempre che n 50 .<br />
Le stesse conclusioni si ottengono nel caso di non indipendenza del campione.<br />
Riassumendo possiamo dire che, nel caso di campione indipendente, la stima centrata<br />
2<br />
2<br />
ˆ ˆ della varianza <br />
n<br />
ˆ di ˆ <br />
n n è data da<br />
<br />
ˆ <br />
2<br />
ˆ <br />
n<br />
2<br />
2 2<br />
2 n,1 2 n sn<br />
ˆ sn<br />
<br />
n<br />
<br />
<br />
n<br />
ˆ 1<br />
n n n1 n1<br />
mentre nel caso di campione con elementi non indipendenti si ha<br />
31
32<br />
2<br />
2 N n<br />
ˆ <br />
n n N 1<br />
2 2<br />
2 ˆ n,2 N n 1 2 n N 1N n<br />
sn n <br />
ˆ ˆ s<br />
1<br />
n<br />
n <br />
n N 1 n n1 N N 1 n1 N <br />
Vediamo un semplice esempio. Si è ricevuto un lotto di N 1000 barrette di ferro<br />
qualitativamente omogenee, ovvero ottenute con un ciclo di produzione in cui tutti i fattori<br />
caratteristici sono stati mantenuti costanti (fornitore delle materie prime, stesse macchine operatrici<br />
utilizzate, stessa squadra di operai). Da un campione di n 50 unità si è ricavato che le barrette<br />
2 2<br />
hanno un diametro medio di ˆ n 3.5mm<br />
con una varianza campionaria sn 0.09mm<br />
. Si stima<br />
quindi il valore medio dei diametri su tutto il lotto con il valore ˆ n 3.5mm<br />
, che sappiamo<br />
essere una stima non affetta da errore sistematico. Per valutare la variabilità della stima supponiamo<br />
di avere preso un campione con gli elementi scelti tutti indipendentemente uno dall’altro<br />
(chiariremo poi questo concetto), allora la stima centrata della varianza<br />
2<br />
n<br />
2 s<br />
ˆ ˆ 0.00183<br />
n n 1<br />
2<br />
ˆn è data da<br />
mentre nel caso che gli elementi del campione non siano scelti tutti indipendentemente uno<br />
dall’altro si ha<br />
2<br />
n<br />
2 s n <br />
ˆ ˆ 1 0.00174<br />
n <br />
n1 N <br />
Nell’ipotesi che la distribuzione dei valori del diametro delle barrette possa ritenersi<br />
gaussiana nel lotto, dato che n 50 , la stima di ˆ n è da ritenersi accurata, nel senso che il<br />
2<br />
coefficiente di variazione della stima della sua varianza ˆ ˆ è non superiore al 20%.<br />
n<br />
Se volessimo rendere la stima ˆ n più accurata dovremmo aumentare la numerosità del<br />
2<br />
campione; infatti, volendo ridurre la varianza ˆ ˆ a 0.0004 otterremmo<br />
n<br />
nel caso di campionamento indipendente e<br />
0.09 0.09<br />
0.0004 n 1226 n 1<br />
0.0004<br />
0.09 n 1000(0.09 0.0004)<br />
0.0004 1 n 184<br />
n 1 1000 <br />
0.0004*1000 0.09
nell’altro caso.<br />
Il prelievo del campione fatto in modo che tutti gli elementi siano scelti in modo<br />
indipendente uno dall’altro significa in sostanza che il fatto di selezionare un elemento dalla<br />
popolazione per metterlo nel campione, non deve alterare la composizione statistica della<br />
popolazione. Questo può essere ottenuto sostanzialmente in due modi: se la dimensione della<br />
popolazione non è molto grande rispetto a quella del campione da prelevare si effettua un<br />
campionamento con reinserzione; nel caso contrario se N n si può ritenere che il prelievo del<br />
campione alteri la composizione statistica della popolazione in modo trascurabile. Naturalmente la<br />
reinserzione può essere praticata se l’analisi del campione non modifica in alcun modo i suoi<br />
elementi: nell’esempio della misura del diametro delle barrette questo si verifica, ma nell’esempio<br />
della misura del carico di rottura, l’elemento analizzato verrebbe distrutto e quindi diventerebbe non<br />
reinseribile! In questo caso il campionamento sarebbe necessariamente senza reinserzione, e la<br />
indipendenza del campione dipenderebbe solo, come detto, dal confronto tra la numerosità della<br />
popolazione e quella del campione stesso!<br />
Riassumiamo con una tabella sinottica i risultati della stima puntuale di valore medio e<br />
varianza di una popolazione ottenuta da un campione dei suoi elementi<br />
Valori di<br />
popolazione<br />
Valor medio <br />
Stime campionarie<br />
Campione indipendente Campione non indipendente<br />
1 n<br />
ˆ x<br />
n<br />
n j<br />
j1<br />
ˆ <br />
1<br />
n<br />
n<br />
n x j<br />
j1<br />
2<br />
Varianza 2<br />
2 n 2<br />
ˆ n,1 sn n1 1 n<br />
x ˆ j n<br />
n1<br />
j1<br />
2<br />
2 n N 1 2 N 1 1 n <br />
ˆ ˆ<br />
n,2 sn xj<br />
n<br />
<br />
n1 N N n1 j1<br />
<br />
2<br />
Varianza ˆ n<br />
della stima ˆ n<br />
2 2<br />
ˆ 2 n,1 1 2 n sn<br />
ˆ ˆ s<br />
n<br />
n <br />
n n n1 n<br />
1<br />
2 2<br />
ˆ 2 n,2 N n sn n <br />
ˆ ˆ 1<br />
n<br />
<br />
n N 1 n1 N <br />
2<br />
4<br />
4 <br />
2 1 n<br />
E <br />
2 X <br />
n 3<br />
sn xj mn<br />
; <br />
2<br />
2 (varianza di ˆ 4<br />
n j1<br />
ˆ <br />
n,1<br />
, valore di popolazione)<br />
n,1<br />
n n1<br />
<br />
33
34<br />
Stima di intervallo e controllo statistico della qualità<br />
Quindi abbiamo visto come la media aritmetica ˆ n costituisca una buona stima del valore<br />
2<br />
n<br />
medio di una v.a. X con varianza , di cui si sono considerati n determinazioni xii 1<br />
indipendenti; si è supposto quindi che il campione di dati sperimentali sia stato prelevato da una<br />
popolazione molto grande, ovvero sia stato prelevato con reinserzione da una popolazione finita. In<br />
tale caso si ha<br />
E[ ˆ ] ,<br />
n<br />
2 2<br />
n n,1<br />
E[( ˆ ) ] ˆ / n .<br />
Come si vede, la stima di valor medio è una stima accurata in quanto ha distorsione nulla, e la sua<br />
precisione aumenta all'aumentare della dimensione n del campione casuale analizzato, in quanto la<br />
varianza della stima è inversamente proporzionale a n .<br />
In definitiva, il parametro incognito viene valutato mediante una sua stima puntuale ˆ n che ha<br />
una variabilità misurata da 2 ˆ n,1<br />
/ n . Questo significa che se si analizzassero più campioni di<br />
dimensione n , si otterrebbero tanti valori differenti della stima puntuale ˆ n , ma che si localizzano<br />
intorno al valore incognito , potendo peraltro presentare errori ˆ n positivi e negativi che<br />
hanno mediamente un range dell'ordine di ˆ n,1<br />
/ n .<br />
Da quanto detto la stima puntuale del valor medio per essere apprezzabile deve essere<br />
accompagnata anche dal valore della sua dispersione, cioè dalla misura della sua variabilità.<br />
Ci si chiede quindi se non sia possibile rappresentare la stima con un unico elemento che faccia<br />
comparire in modo esplicito la variabilità della stima. In altre parole appare di più facile<br />
interpretazione poter fornire un intervallo I ,n di possibili valori tale che si possa ritenere con una<br />
certa confidenza che il valore incognito appartenga a tale intervallo<br />
n <br />
P I, 1 %<br />
In questo caso non si fornirebbe un unico valore ˆ n per , attendibile a meno di un errore medio<br />
pari a ˆ n,1<br />
/ n , ma un intervallo I ,n di valori attendibili per con una confidenza dell' 1 % .<br />
Vediamo come fare.<br />
Consideriamo la v.a. standardizzata<br />
ˆ n <br />
n<br />
<br />
ˆ / n<br />
n,1<br />
che ha quindi valor medio nullo e varianza pari a 1. Se si conoscesse la distribuzione di tale<br />
variabile aleatoria, potremmo risolvere il seguente problema: assegnato il valore % trovare il<br />
valore per cui risulti<br />
P n 1 <br />
%
Ora, dal teorema del limite centrale sappiamo che per n la variabile standardizzata n tende<br />
in distribuzione ad una gaussiana standard N (0,1) . Questo implica che, se n è abbastanza grande ,<br />
la probabilità dell'evento n possa essere calcolata usando la distribuzione limite<br />
A questo punto, scelto %<br />
2<br />
t<br />
/2<br />
e<br />
P n dt<br />
2<br />
, il valore di tale che 1 %<br />
<br />
P è dato dal percentile<br />
della gaussiana, ottenibile dall'opportuna tabella dei percentili. Infatti si ricordi che il valore <br />
che risolve il problema precedente, risolve anche il seguente<br />
%<br />
P P<br />
che fa riferimento all'evento complementare, ed è esattamente l'evento che viene considerato sulle<br />
tabelle dei percentili.<br />
A questo punto sappiamo che con una confidenza del 1 % il valore n ottenuto dai dati<br />
sperimentali sarà compreso nel seguente intervallo<br />
cioè<br />
da cui con semplici passaggi si ottiene<br />
n<br />
e quindi, ricordando che ˆ ,1 s<br />
n 1<br />
n <br />
ˆ <br />
<br />
n<br />
<br />
ˆ n,1<br />
/ n<br />
ˆ ˆ <br />
ˆ ˆ <br />
n n<br />
2 2<br />
n n<br />
n,1 n,1<br />
n n <br />
, si ha<br />
s<br />
ˆ n s<br />
ˆ<br />
n<br />
n n <br />
n1 n<br />
1<br />
L’ultima relazione stabilisce un intervallo di confidenza I ,n cui apparterrà il valore<br />
incognito della media della popolazione con probabilità 1 % . Come si vede dalla sua<br />
espressione, fissato % , l’ampiezza I ,n<br />
di tale intervallo dipende sostanzialmente dalla<br />
numerosità del campione<br />
s<br />
, ˆ n s<br />
ˆ n sn<br />
I n n n 2<br />
n1 n1 n1<br />
per cui, all'aumentare della dimensione del campione analizzato, a parità di confidenza,<br />
n<br />
35
36<br />
l'intervallo I ,n diventa più stretto, dando luogo ad una valutazione più precisa dei valori attendibili<br />
del parametro incognito .<br />
Ovviamente nel caso che il campione fosse stato non casuale, con ragionamenti del tutto<br />
analoghi, avremmo ottenuto I ,n pari a<br />
di lunghezza pari a<br />
s<br />
ˆ n n s<br />
1 ˆ<br />
n n<br />
n n 1<br />
n1 N n1<br />
N<br />
sn n<br />
I, n 2 1<br />
n 1<br />
N<br />
Nell'espressione dell'intervallo di confidenza si è potuto utilizzare il percentile della gaussiana<br />
standard nell'ipotesi che n fosse abbastanza grande da ritenere soddisfatto il teorema del limite<br />
centrale, ed utilizzare quindi la distribuzione limite per calcolare la probabilità degli eventi della<br />
variabile n . Se la distribuzione dei dati fosse gaussiana, allora basterebbe n 50 . Se invece fosse<br />
dissimmetrica, con una curtosi al più uguale a 2, allora dovrebbe essere n 100 . Se infine si avesse<br />
un'alta probabilità di avere valori estremi (cioè molto lontani dalla media) , con curtosi quindi<br />
maggiore di 2, allora dovrebbe essere 500<br />
n .<br />
Nel caso in cui i dati a disposizione non soddisfacessero nessuna delle condizioni<br />
precedenti, ad esempio n 30 sempre per un campione casuale, allora si può avere la distribuzione<br />
della v.a. standardizzata n solo nel caso in cui si possa validare un'ipotesi di gaussianità dei dati.<br />
In tal caso infatti la variabile standardizzata<br />
ˆ n <br />
n<br />
<br />
s / n 1<br />
ha distribuzione t-student con n 1 gradi di libertà, per cui il valore per cui, fissato % , si ha<br />
n<br />
P n 1 % oppure P %<br />
è dato dal percentile t della distribuzione t-student con n 1 gradi di libertà (ottenibile<br />
dall'opportuna tabella dei percentili) , ottenendo per l’intervallo di confidenza<br />
sn sn<br />
ˆ ˆ<br />
n t n t<br />
n1 n<br />
1<br />
Vediamo un esempio. Un’officina meccanica deve stimare il carico medio di rottura di un<br />
cospicuo lotto di pezzi. Si seleziona un campione di 100 unità e si determina m 1115 2<br />
Kg/ cm e<br />
n
2<br />
sn 2,16 Kg/ cm . Dalla tabella della N(0,1) si ricava che con 0.05 sia ha 1.96 , per cui<br />
il carico di rottura medio si trova nell’intervallo<br />
2.16 2.16 <br />
1115 1.96 ,1115 1.96 1114.57,1115.42 /<br />
100 1100 1<br />
2<br />
kg cm<br />
con una confidenza di 0.95. Se aumentassimo il campione analizzato a 300 unità si otterrebbe un<br />
intervallo di confidenza dello 0.95 pari a<br />
2.16 2.16 <br />
1115 1.96 ,1115 1.96 1114.8,1115.2 /<br />
300 1300 1<br />
2<br />
kg cm<br />
quindi più ristretto rispetto al precedente, costituendo quindi un intervallo di valori più preciso per il<br />
carico di rottura medio .<br />
La stessa officina vuole determinare il valore medio dello spessore di un lotto di lamine; tale<br />
2<br />
grandezza risulta avere distribuzione gaussiana con media e varianza incognite. Si preleva<br />
un campione di 14 barrette e si determina n 52.52 mm e sn 3.37 mm.<br />
Siccome n 30,<br />
stavolta dobbiamo usare la distribuzione t-student per determinare l’intervallo di confidenza per lo<br />
spessore medio . Dalla tabella per 0.05 si ottiene t 2.160 per 13 gradi di libertà, per cui si<br />
ha<br />
con confidenza pari a 0.95.<br />
3.37 3.37 <br />
52.52 2.16 , 52.52 2.16 50.5011,54.5389<br />
14 114 1<br />
<br />
37
38<br />
Controllo di qualità.<br />
L’intervallo di confidenza viene utilizzato nel controllo statistico della qualità di un processo<br />
di produzione. In condizioni nominali le unità prodotte presentino, per quanto concerne un certo<br />
2<br />
attributo, una distribuzione gaussiana con un valor medio ed una varianza , noti perché<br />
determinati in modo preliminare (cioè determinati con un esperimento dedicato, con un campione di<br />
dati differente da quelli attualmente in esame) usando i metodi descritti precedetemente. Per<br />
controllare che il processo mantenga la qualità nel tempo, vengono prelevati ad intervalli regolari<br />
dei campioni di dimensione n e su questi si calcola la media campionaria ˆ n ; dato che la<br />
distribuzione si suppone gaussiana, n può essere scelto anche piccolo, ad esempio 5 o 10, e la<br />
variabile normalizzata<br />
ˆ n <br />
n<br />
<br />
/ n<br />
è certamente N(0,1); quindi fissando 0.05 otteniamo 1.96 per cui<br />
Ciò significa che l’evento<br />
<br />
P<br />
ˆ n 0.95 n <br />
<br />
ˆ n <br />
n n<br />
<br />
ˆ n n n<br />
occorre con probabilità del 95%. La qualità del processo di produzione è quindi da ritenersi idonea<br />
se ˆ n si mantiene nell’intervallo <br />
<br />
/<br />
ˆ n<br />
n, <br />
/ n<br />
<br />
<br />
/ n<br />
<br />
<br />
/ n<br />
<br />
<br />
tempo
Qualora ˆ n dovesse uscire dai limiti prefissati si dovrebbe intervenire subito per individuare le<br />
cause che hanno determinato questo scostamento significativo della qualità della produzione dallo<br />
standard (utensile logorato, inquinamento dei reagenti, ecc.).<br />
Test di confronto.<br />
In molti casi pratici si deve poter confrontare la stima di campionaria di una statistica ( media,<br />
varianza, frequenza relativa) con valori considerati come noti, evidentemente acquisiti da indagini<br />
precedenti. Esaminiamo ad esempio il seguente caso.<br />
Una compagnia di televisione via cavo asserisce che il 60% degli abitanti della zona di<br />
esercizio possiede la televisione via cavo, mentre una compagnia di televisione satellitare crede che<br />
il precedente valore sia troppo grande, dopo aver effettuato un rilevamento per cui 81 abitazioni<br />
avevano la televisione via cavo e 69 ne erano sprovviste. La compagnia di televisione via cavo<br />
afferma che tale differenza è solo dovuta al caso. A quale delle due compagnie dareste ragione, con<br />
una confidenza del 95%?<br />
La compagnia di televisione via cavo sostiene che in media la proporzione p delle persone<br />
nella popolazione di riferimento che hanno la tv via cavo è pari a 0.6, potendo la proporzione<br />
effettiva variare entro certi limiti. Il valore di questa proporzione, risultante dall'esame del campione<br />
di abitazioni effettuato dalla compagnia di tv satellitare, è di 81/(81+69)=0.54. C'è quindi uno<br />
scostamento significativo del valore stimato della proporzione pˆ 0.54 dal valore di riferimento<br />
ipotizzato p 0.6 . La compagnia di tv via cavo sostiene che tale scostamento rientra nella<br />
variabilità naturale insita nella stima campionaria di p ; per cui l'ipotesi nulla è che il valore di<br />
riferimento della proporzione di abitazioni con tv via cavo sia del 60%<br />
Confronto tra proporzioni<br />
H<br />
H<br />
0<br />
1<br />
: p 0.6<br />
: 0.6<br />
Per validare o meno questa ipotesi, basta appunto misurare la variabilità della stima della<br />
2<br />
proporzione p e costruire un set critico con significatività del 5%<br />
p p 2 p<br />
con il percentile del 10% in modo che la singola coda misuri 5%. La regola di rifiuto dell'ipotesi<br />
nulla è unilaterale perché pˆ p e la compagnia di tv satellitare ritiene che appunto che p 0.6<br />
sia troppo grande.<br />
La misura delle proporzioni segue la distribuzione binomiale: in una popolazione in cui un<br />
dato evento occorre con probabilità p 0 , la probabilità con cui si avranno k risultati favorevoli<br />
all'evento su un campione di N unità (caso delle prove ripetute di Bernoulli) è pari a<br />
N N !<br />
PX ( k) p (1 p) p (1 p)<br />
k <br />
( N k)! k!<br />
p<br />
k Nk k Nk 0 0 0 0<br />
La variabile aleatoria X data dal "n° di successi su N prove indipendenti" viene detta binomiale<br />
ed ha valor medio e varianza pari a<br />
39
40<br />
2<br />
X Np0 X Np0 p0<br />
, (1 )<br />
Tale distribuzione è simmetrica per qualunque N se 0 0.5 p , mentre tende ad essere simmetrica<br />
per qualunque p 0 quanto più N è grande. Dalla distribuzione di X si ottiene subito la distribuzione<br />
della proporzione p X del numero di successi su N prove ripetute: essa è ancora una<br />
N<br />
binomiale, ma con media e varianza pari a<br />
2<br />
X 2 0(1 0)<br />
0, X p p<br />
p p p <br />
N 2<br />
N N<br />
Si dimostra inoltre che se Np0(1 p0)<br />
10 si ha<br />
p p pp0 <br />
: N 0,1 p p0(1 p0)<br />
N<br />
cioè, la variabile aleatoria standardizzata ha distribuzione limite pari alla gaussiana standard. Questo<br />
risultato al solito è fondamentale per dedurre i percentili per gli intervalli di confidenza che<br />
riguardano la variabile aleatoria p . Nel caso in esame infatti abbiamo<br />
e il set critico cercato è pari a<br />
p0(1 p0)<br />
p p00.6, p 0.04, Np0(1 p0)<br />
36 10<br />
N<br />
pˆ 0.6 1.6450.04 0.5342<br />
p 2 p<br />
per cui, dato che pˆ 0.54,<br />
dobbiamo concludere che la compagnia di tv via cavo aveva ragione,<br />
con un rischio del 5% di prendere la decisione sbagliata.<br />
Nel prossimo caso le proporzioni da confrontare sono estratte da due campioni differenti.<br />
La malattia di Lyme o Borreliosi è una infezione batterica che colpisce le articolazioni, il sistema<br />
nervoso, gli organi interni e la pelle dei gatti. Il contagio avviene per via delle zecche. Vogliamo<br />
valutare l'efficacia di un nuovo antibiotico X nella terapia contro la Borrelliosi, confrontandola<br />
con quella dell' amoxicillina. A questo scopo, analizziamo i test clinici su una popolazione di gatti<br />
affetti da Borrelliosi in cura presso alcuni ambulatori veterinari in un trimestre. I dati raccolti sono<br />
riportati in tabella<br />
guariti non guariti totale % guariti<br />
X 56 14 70 80<br />
amoxicillina 52 23 75 69.33<br />
totale 108 37 145 74.48
In particolare, si noti che su un totale di 145 gatti, 70 sono stati sottoposti a trattamento con il nuovo<br />
antibiotico X e di questi l'80% sono guariti ( 56 su 70). Per i restanti 75 gatti, trattati con<br />
amoxicillina, si è avuta una percentuale di guarigione pari al 69.33% (52 su 75). Sembrerebbe che il<br />
nuovo farmaco sia più efficace. Tuttavia, bisogna assicurarsi che la differenza tra le percentuali dei<br />
guariti nei due gruppi sia significativa e non dovuta al caso.<br />
Nel gruppo di gatti trattati con X si ha quindi una proporzione pˆ 1 0.8 di soggetti guariti su un<br />
campione di n1 70 unità, prelevato da una popolazione in cui la proporzione dei guariti è un<br />
2 p<br />
valore p 1 . Per quanto visto precedentemente sia ha che Ep [ ˆ1]<br />
p1<br />
e 1(1 p1)<br />
pˆ<br />
.<br />
1 n1<br />
Analogamente per il gruppo di n2 75 unità trattato con amoxicillina si osserva una proporzione di<br />
soggetti guariti pˆ 2 0.7 , con Ep [ ˆ2]<br />
p2<br />
e <br />
2 2 2<br />
pˆ<br />
2 n2<br />
41<br />
p (1 p )<br />
. Ora come statistica del test possiamo<br />
scegliere la differenza delle proporzioni p pˆ1 pˆ2,<br />
che avrà valor medio pari a E p p1 p2,<br />
2 2 2<br />
e varianza ˆ p p 1 p dato che i due gruppi di dati sono indipendenti. Dobbiamo quindi testare<br />
2<br />
le seguenti ipotesi<br />
1<br />
<br />
<br />
H0: E p p1 p2<br />
0<br />
H : E p 0<br />
L'ipotesi nulla H0 si riferisce al caso in cui i due trattamenti sono equivalenti e la differenza tra le<br />
proporzioni osservate è del tutto casuale. La statistica del test, se è vera H 0 è<br />
<br />
pE p p p<br />
<br />
2 2 2 2<br />
pˆ 1 pˆ <br />
2 pˆ <br />
1 pˆ<br />
1 1 <br />
2 p0(1 p0)<br />
<br />
n n<br />
1 2 <br />
dove p0 è la proporzione totale di guariti sull'unione dei due gruppi<br />
56 52<br />
p0<br />
0.7448<br />
70 75<br />
Se n1n2 p01 p0<br />
10,<br />
la statistica del test ha distribuzione gaussiana standard, per cui il set<br />
critico del test è<br />
p<br />
<br />
1 1 <br />
p0(1 p0)<br />
<br />
n n<br />
1 2 <br />
con <br />
percentile dell' %<br />
di (0,1)<br />
N . Nel nostro caso, volendo effettuare un test con significatività<br />
del 5%, otterremmo
42<br />
0.80 0.6933<br />
1.3802 1.96<br />
1 1 <br />
0.7448(1 0.7448) <br />
70 75 <br />
per cui dovremmo accettare l'ipotesi H 0 e ritenere che il nuovo farmaco X abbia avuto un effetto<br />
non significativamente differente da quello ottenuto con l' amoxicillina. In effetti, volendo testare se<br />
sia conveniente usare il nuovo farmaco, avremmo fatto meglio ad eseguire un test unilaterale,<br />
impostando l'ipotesi alternativa sul fatto che ci si aspetta che il nuovo farmaco abbia una<br />
percentuale di guariti superiore rispetto all'amoxicillina, i.e. H1 : Ep <br />
0.<br />
Consideriamo ora un altro caso di studio.<br />
Per valutare l’efficacia antirughe, elasticizzante, “ridensificante” e riparatrice per la barriera<br />
cutanea di un trattamento cosmetico è stato eseguito uno studio 1 clinico su 10 soggetti sani di sesso<br />
femminile. Vengono riportati in tabella i dati relativi all'elasticità cutanea prima del trattamento<br />
(tempo T 0 ) e dopo quindici giorni di trattamento (tempo T 15 ). Il trattamento cosmetico è stato<br />
efficace?<br />
Confronto tra medie, misure appaiate<br />
Per rispondere al quesito si può ragionare così. Per ogni soggetto si<br />
misura la stessa grandezza, l'elasticità cutanea, in due tempi<br />
differenti. Per cui in effetti è come se si misurasse la variazione di<br />
elasticità cutanea per ogni soggetto; di conseguenza alla tabella<br />
precedente potremmo sostituire quella ottenuta dalle differenze dei<br />
dati per ogni soggetto<br />
0.0345 -0.0054 0.0244 0.0402 0.0625 0.0400 -0.0196 -0.0281 0.0006 0.0695<br />
con media ˆ d 0.0219 e deviazione standard ˆ d 0.0336 .<br />
Ora se il trattamento non ha avuto effetto, vuol dire che mediamente le differenze dei valori<br />
dell'elasticità cutanea è zero; mentre si avranno effetti significativi se la media delle differenze è<br />
significativamente differente da zero. Per cui, se la nostra ipotesi nulla corrisponde all'assenza di<br />
effetto significativo del farmaco, possiamo scrivere<br />
H0: Eˆ<br />
d<br />
<br />
0<br />
H : E ˆ 0<br />
1<br />
<br />
1 http://www.biotivia.cc/attachments/down/Celle%20-%20CLINICAL%20TEST.pdf<br />
d
in quanto per l'ipotesi alternativa dobbiamo considerare che l'effetto del cosmetico deve produrre un<br />
aumento dell'elasticità cutanea. Possiamo quindi disporre un test unilaterale di ipotesi semplice con<br />
un livello di significatività del 5%; il set critico avrà quindi la seguente forma<br />
<br />
ˆ E ˆ ˆ E ˆ <br />
d d 2 ˆ d 2<br />
Facciamo ora l'ipotesi di gaussianità dei dati (da verificare eventualmente con un opportuno test); in<br />
questo modo potremo scegliere il percentile 2 come il percentile del 10% di una t-Student a 9<br />
gradi di libertà ottenendo il seguente set critico<br />
0.0336<br />
ˆ d 0 1.833 0.0195<br />
10<br />
Dato che ˆ d 0.0219 è maggiore di 0.0195, dobbiamo rifiutare l'ipotesi nulla e ritenere, con una<br />
confidenza del 95%, che il cosmetico abbia avuto effetto.<br />
Nel caso esaminato, la variabilità dei dati era legata alla presenza di soggetti differenti in uno stesso<br />
gruppo. In altre situazioni i dati variano anche per il fatto che i dati si riferiscono a gruppi differenti<br />
di soggetti. Il caso che segue chiarisce questo aspetto. Per semplicità di notazioni, le medie<br />
calcolate su due gruppi di n 1 e n 2 dati, saranno indicate con 1 ˆ e ˆ 2 anziché ˆ n1, ˆ n2.<br />
Un’azienda produce disinfettante industriale concentrato, in confezioni per le quali dichiara che è<br />
possibile ottenere mediamente 150 litri di disinfettante con una varianza pari a 36 litri 2 . La<br />
produzione avviene in due stabilimenti separati. Un primo rivenditore analizza un campione casuale<br />
di 225 confezioni, prelevato dal primo stabilimento, e ottiene una media 1 ˆ di 148 litri di<br />
disinfettante; un secondo rivenditore analizza un campione casuale di144 confezioni, prelevato<br />
dall'altro stabilimento, e ottiene una quantità media ˆ 2 di disinfettante pari a 151 litri. La differenza<br />
tra queste rilevazioni è significativa oppure è da ritenersi dovuta alla naturale variabilità del<br />
prodotto?<br />
Confronto tra medie, misure non appaiate, varianza nota<br />
Come sappiamo, la stima di valor medio è centrata, per cui risulta che 1 ˆ E[ ] con varianza<br />
2<br />
2 36<br />
2 36<br />
ˆ 0.16 e E[ ˆ <br />
1<br />
2]<br />
con varianza ˆ 0.25 . Ora possiamo scegliere<br />
2<br />
n 225<br />
n 144<br />
come statistica del test la differenza tra i valori medi rilevati sui due campioni indipendenti<br />
ˆ ˆ ˆ , per la quale possiamo testare le ipotesi<br />
d<br />
2 1<br />
1<br />
d<br />
ˆ d<br />
<br />
ˆ <br />
H0: E 0<br />
H : E <br />
0<br />
d<br />
2<br />
ˆ <br />
d<br />
n<br />
43
44<br />
L'ipotesi nulla corrisponde al caso in cui la differenza osservata sia da attribuire al caso, mentre<br />
l'ipotesi alternativa corrisponde al fatto che i due stabilimenti hanno una differenza sistematica nella<br />
produzione del disinfettante. Se è vera H 0 abbiamo che E[ ˆ d ] 0 mentre, indipendentemente da<br />
2 2 2<br />
H0, H 1 risulta ˆ1 ˆ 0.16 0.25 0.41<br />
d . La scelta dell'ipotesi alternativa determina un<br />
2<br />
set critico bilaterale<br />
ˆ E[<br />
ˆ ] ˆ <br />
<br />
d d d<br />
d<br />
2<br />
2<br />
<br />
1 2<br />
Se possiamo validare un'ipotesi di gaussianità dei dati, possiamo scegliere =1.96 corrispondente<br />
al percentile del 5% di una gaussiana standard. In questo caso si otterrebbe<br />
ˆ d<br />
151148 3<br />
4.685 1.96<br />
0.41 0.41<br />
2 2<br />
<br />
1 2<br />
Si dovrebbe quindi accettare l'ipotesi alternativa e ritenere che ci siano cause sistematiche nel<br />
processo di produzione dei due stabilimenti che determina una differenza significativa nella qualità<br />
del prodotto fornito.<br />
Il più delle volte la varianza dei dati, differentemente dal caso appena esaminato, è incognita.<br />
Questo accade ad esempio nel problema che segue 2 .<br />
E' stato condotto uno studio clinico per la valutazione<br />
dell’efficacia della Tulatromicina nella prevenzione delle<br />
forme respiratorie del bovino da carne (BRD), nelle normali<br />
condizioni d’allevamento italiane. La patologia esordisce<br />
con sintomi generali (abbattimento e riduzione<br />
dell’appetito) che, nell’arco di poche ore, si accompagnano<br />
a febbre, dispnea, tosse, scolo nasale (catarrale e/o muco<br />
purulento, vedi figura) e nei casi più gravi e senza un<br />
adeguato intervento, evolvono in pochi giorni verso una<br />
polmonite grave che può condurre a morte l’animale.<br />
In tabella vengono riportati i dati relativi all'esperimento: un<br />
gruppo di n1 89 bovini è stato trattato con Tulatromicina ed<br />
un secondo gruppo n2 81con<br />
Tilmicosina. Dopo 60 giorni<br />
si è osservato un peso medio per il primo gruppo di<br />
ˆ 1 537.39 Kg con una deviazione standard<br />
1 ,1 ˆ n 42.96<br />
Kg, mentre per il secondo gruppo si è ottenuto un peso<br />
ˆ 529.49 Kg con una deviazione standard<br />
ˆ 41.47 Kg.<br />
n<br />
2 ,1<br />
medio 2<br />
2 Tratto da: M. Muraro et al. Large Animal Review 2008; 14: 267-272 267.
Confronto tra medie, misure non appaiate, varianza incognita<br />
Siamo in presenza ancora di un caso in cui i dati appartengono a due gruppi differenti di soggetti<br />
per cui essi non possono considerarsi appaiati. Si devono confrontare quindi due medie per capire se<br />
la loro differenza sia significativa o dovuta al caso. La varianza dei dati è incognita, ma le varianze<br />
del peso dei bovini sono state stimate dai dati dei due campioni di 89 e 81 unità. Nell'ipotesi (da<br />
verificare con un test ovviamente!) che la varianza dei dati sia costante, e che la differenza tra ˆ n<br />
e<br />
2<br />
2,1<br />
ˆ n<br />
sia del tutto casuale, la varianza di d 2 1<br />
ˆ ˆ ˆ è data dalla seguente espressione<br />
2 2<br />
ns n1 n1<br />
2 1 n n 2 2<br />
1 2sn<br />
2 1 1 2 1 2 1<br />
, <br />
1 1, ˆ1, 2<br />
2, ˆ<br />
d<br />
sn x i sn x i 2<br />
n1 n2 2 n1 n2 n1 i1 n2<br />
i1<br />
<br />
<br />
che viene detta pooled variance. In questo caso, nell'ipotesi di gaussianità dei dati, la statistica del<br />
test di confronto tra medie<br />
H0: Eˆ<br />
d<br />
<br />
0<br />
H1: E<br />
ˆ d<br />
<br />
0<br />
è data da<br />
ˆ d<br />
2 2<br />
ns 1 n n<br />
1 2sn<br />
2 1 1 <br />
<br />
n1n2 2n1 n2<br />
<br />
e segue una distribuzione t-Student a n1n2 2 gradi di libertà. Per cui il set critico unilaterale di<br />
significatività % sarà dato da<br />
Nel caso di studio si ottiene<br />
ˆ d<br />
t<br />
2 2<br />
ns 1 n n<br />
1 2sn<br />
2 1 1 <br />
<br />
n1n2 2n1 n2<br />
<br />
n1n22,2 7.9<br />
1.2174t168,0.10 1.645<br />
6.4891<br />
per cui si accetta l'ipotesi nulla e si conclude che il trattamento con Tulatromicina non ha avuto un<br />
effetto significativamente differente dal trattamento con Tilmicosina.<br />
Nel caso in cui si debba rifiutare l'ipotesi che la varianza dell'insieme dei dati del primo e del<br />
secondo gruppo sia costante, allora si può usare la seguente statistica<br />
<br />
45<br />
2<br />
1,1
46<br />
ˆ <br />
ˆ <br />
d<br />
2 2<br />
ˆ<br />
n1,1<br />
n2,1<br />
<br />
n1 n2<br />
che seguirà approssimativamente una distribuzione t-Student, nell'ipotesi di gaussianità dei dati, con<br />
gradi di libertà ottenuti dal termine di correzione di Welch- Satterwhaite<br />
t<br />
gdl,<br />
<br />
2 2 ˆ n1,1 ˆ <br />
n2,1<br />
<br />
n n <br />
gdl <br />
2 2<br />
n1,1 n2,1<br />
<br />
n1 n2<br />
<br />
<br />
<br />
<br />
n 1 n 1<br />
1 2 <br />
ˆ <br />
2<br />
ˆ <br />
2<br />
1 2<br />
ovviamente si prende come numero di gradi di libertà il valore intero della precedente espressione.<br />
Confronto tra varianze<br />
I test di confronto tra proporzioni e tra medie appena visti, possono applicarsi anche al caso in cui<br />
si debbano confrontare le varianze.<br />
Si consideri a esempio un insieme di dati per cui si ipotizzi una distribuzione gaussiana con media<br />
e varianza<br />
2<br />
. Si estragga un campione casuale di n unità è si verifichi l'ipotesi<br />
H<br />
H<br />
2 2<br />
0 : n,1<br />
2 2<br />
1 : n,1<br />
Se l'ipotesi nulla è vera si può dimostrare facilmente che la grandezza<br />
ha distribuzione<br />
n<br />
2<br />
(<br />
xi<br />
ˆ n)<br />
2 2<br />
i1( n 1)<br />
n,1<br />
nsn<br />
<br />
2 2 2<br />
<br />
2<br />
n 1 con n 1 gradi di libertà. Il set critico per il test posto sarà quindi<br />
( n 1)<br />
n<br />
<br />
2<br />
2<br />
,1 2<br />
n1,<br />
<br />
2<br />
n 1, è il percentile dell' % . Nel caso in cui l'ipotesi alternativa fosse stata<br />
dove<br />
allora il set critico con significatività dell' % sarebbe stato<br />
( n 1)<br />
n<br />
<br />
2<br />
2<br />
2<br />
,1 2<br />
<br />
n1,1<br />
2 2<br />
1 : n,1<br />
H ,
2 2<br />
1 : n,1<br />
mentre se l'ipotesi alternativa fosse stata H<br />
di livello %<br />
, allora avremmo avuto il seguente set critico<br />
2 2<br />
( n1) <br />
n,1 2 ( n1)<br />
<br />
<br />
n,1<br />
2 <br />
<br />
2 n1,1 /2 <br />
2 n1,<br />
/2<br />
<br />
<br />
Concludiamo questo paragrafo considerando il caso di differenze tra varianze. Vogliamo<br />
confrontare le varianze di due campioni di dati con distribuzione gaussiana con parametri ( , )<br />
2<br />
e ( 2, 2)<br />
rispettivamente. Si vuole verificare l'ipotesi<br />
2 2<br />
H1: 1 2 . A questo punto dal primo campione di 1<br />
2<br />
dal secondo gruppo di n 2 dati stimiamo n ,1<br />
ˆ n e<br />
2<br />
2 2<br />
0: 1 2<br />
2<br />
1 1<br />
H contro l'ipotesi alternativa<br />
n dati stimiamo<br />
ˆ n e<br />
1<br />
2 ,1<br />
n1<br />
47<br />
, e analogamente<br />
(entrambi i gruppi si intendono essere due<br />
2<br />
campioni casuali di dati). Ora, per quanto visto prima, la variabile<br />
2<br />
n1<br />
1<br />
n<br />
1<br />
<br />
i1<br />
2<br />
i ˆ n<br />
2<br />
1 ( n1<br />
1)<br />
n1,1<br />
<br />
2 2<br />
1 1<br />
( x )<br />
è distribuita come una , mentre la variabile<br />
2<br />
n2<br />
1<br />
n<br />
2<br />
<br />
j1<br />
2<br />
j ˆ n2<br />
2<br />
( n2<br />
1)<br />
n2,1<br />
<br />
2 2<br />
2 2<br />
( x )<br />
è distribuita come una . Per cui, se l'ipotesi nulla è vera, la variabile<br />
2<br />
n1,1<br />
F1, <br />
2 2<br />
,1<br />
ha una distribuzione Fisher con 1 n11, 2 n2 1 gradi di libertà. Per cui il set critico di livello<br />
% per cui si rifiuta l'ipotesi nulla è<br />
2 2<br />
1: 1 2<br />
F F<br />
n2<br />
, , , <br />
1 2 1 2<br />
Se l'ipotesi alternativa fosse stata H , avremmo scelto come statistica del test il reciproco<br />
della precedente F'2, 1 1/ F1,<br />
ed il set critico sarebbe stato<br />
2<br />
F' F<br />
Infine, se l'ipotesi alternativa fosse stata<br />
, , , <br />
2 1 2 1<br />
2 2<br />
1: 1 2<br />
H avremmo ottenuto il seguente set critico
48<br />
Confronto tra varianze di più gruppi<br />
F' , F , , /2 F , F<br />
, , /2<br />
2 1 2 1 1 2 1 2<br />
In molti casi pratici l’insieme di dati in esame è costituito da più di due gruppi per i quali è<br />
necessario sapere se hanno tutti la stessa varianza, ovvero almeno due gruppi hanno varianza l’uno<br />
differente dall’altro. Nel primo caso si dice che l’insieme di dati è omoschedastico, nell’altro caso<br />
che è eteroschedastico. Per decidere se un insieme di dati sia omoschedastico si ricorre al solito a<br />
dei test satistici. Come dati di partenza si consideri un insieme di N dati costituito da k gruppi<br />
costituiti da n 1 , n2<br />
, , nk<br />
unità rispettivamente con medie 1 , 2<br />
, , k<br />
e con varianze<br />
2 2 2<br />
, , , k .<br />
1<br />
2<br />
Test di Bartlett. Nel caso in cui l’insieme di dati segua una distribuzione gaussiana si può usare<br />
questo test che prevede le seguenti ipotesi composte<br />
H<br />
H<br />
0<br />
1<br />
2<br />
: <br />
1<br />
2<br />
: <br />
La statistica del test è data dalla seguente variabile<br />
2 ,1<br />
i<br />
2<br />
2<br />
2<br />
j<br />
2<br />
k<br />
per almeno una coppia<br />
2<br />
p<br />
k<br />
k<br />
<br />
i1<br />
i<br />
2<br />
ni,1<br />
( N k)ln ˆ ( n 1)ln<br />
ˆ <br />
T <br />
1 1 1 <br />
1 <br />
<br />
3( k1) n 1 N k<br />
i1 i<br />
<br />
( i,<br />
j)<br />
dove le ˆ n sono le stime corrette delle varianze dei singoli gruppi, mentre<br />
i<br />
2 1 k<br />
2<br />
p ni 1<br />
ni,1<br />
N k i1<br />
<br />
ˆ ˆ <br />
è la sample pooled variance, che abbiamo già incontrato nel caso di due soli gruppi. Le due<br />
espressioni differiscono perché nel caso del confronto tra medie, la pooled variance si riferisce<br />
appunto alla varianza della stima di valor medio. La variabile T segue approssimativamente una<br />
distribuzione<br />
2<br />
k 1,<br />
per cui il set critico di livello % è dato da<br />
2<br />
k 1,<br />
T <br />
Se questo si verifica, l’ipotesi nulla viene rifiutata e l’insieme di dati si ritiene eteroschedastico.<br />
Test di Levene. Questo test è indicato nel caso in cui l’insieme di dati non segua una distribuzione<br />
x , il j-esimo dato dell' i-esimo gruppo, e si definiscano le seguenti grandezze<br />
gaussiana. Sia i j
1 i<br />
z x ˆ , ˆ x<br />
ij , ij , i i<br />
ni<br />
j1<br />
ij<br />
i<br />
n<br />
1 i<br />
<br />
ni<br />
j1<br />
i, j, i, j '<br />
1 k<br />
<br />
N i1<br />
i i, i, j<br />
z z media delle z nell i esimo<br />
gruppo<br />
z n z media dituttele z<br />
La statistica del test è data dalla seguente variabile<br />
che ha distribuzione di Fisher Fk 1 , N k<br />
N k<br />
W <br />
k 1<br />
n<br />
<br />
k<br />
i i<br />
i1<br />
k n j<br />
<br />
i1 j1<br />
<br />
n z z<br />
2<br />
zij , zi<br />
. Il set critico di livello % è il seguente<br />
W <br />
Fk<br />
1,<br />
N k , <br />
per cui se la grandezza W è più grande del percentile dell’ % della Fisher Fk 1 , N k<br />
, l’ipotesi nulla<br />
va rifiutata, e si deve ritenere l’insieme di dati eteroschedastico.<br />
ANOVA (Analysis of Variance) : confronto tra medie di più gruppi<br />
In molte situazioni, l’insieme o popolazione di unità da analizzare può presentare delle<br />
sottostrutture per cui il modello statistico rappresentato dalle medie di insieme (valore medio,<br />
varianza, …) può risultare in una descrizione troppo grossolana della variabilità insita nella<br />
popolazione: infatti parte di questa variabilità non è da attribuirsi al caso, all’evento aleatorio, ma<br />
alla presenza di una variabilità strutturata, determinata appunto da queste sottostrutture: in ognuna<br />
di queste gli elementi hanno un comportamento statisticamente omogeneo, ovvero presentano una<br />
variabilità interamente dovuta a cause aleatorie e bene descritta da medie di insieme, caratteristiche<br />
tuttavia del sottogruppo considerato; queste medie peraltro possono cambiare molto tra i vari<br />
sottogruppi per motivi non di natura aleatoria ma dovuti a meccanismi di natura sistematica! Si<br />
pensi ad esempio ad una produzione che venga effettuata da reparti con esperienza ed affiatamento<br />
differenti; alla vendita di articoli editoriali di varia natura: giornali, settimanali, audiovisivi;<br />
all’effetto di materie prime acquistate da fornitori differenti, come stoffe, filati , reagenti chimici, e<br />
chi più ne ha più ne metta! Consideriamo il caso di un portafoglio costituito da k 4 prodotti<br />
finanziari di cui interessa il numero di scambi giornalieri in borsa su un numero di 10 rilevazioni<br />
per ognuno di essi<br />
2<br />
49
50<br />
N° in migliaia di<br />
Scambi<br />
giornalieri<br />
Prodotti Finanziari<br />
1 2 3 4<br />
61 100 66 86<br />
80 74 52 35<br />
98 85 73 52<br />
64 77 69 70<br />
78 84 80 79<br />
73 95 73 43<br />
57 96 62 60<br />
95 62 50 65<br />
78 80 71 58<br />
86 87 84 82<br />
Media 77 84 68 63<br />
Il numero di rilevazioni per ciascuna classe non deve necessariamente coincidere, e le singole<br />
determinazioni possono considerarsi come estrazioni casuali indipendenti di una v.a. X . In<br />
generale quindi avremo n i , i 1, , k,<br />
rilevazioni sperimentali; indichiamo con x ij la j-esima<br />
rilevazione per la classe i-esima ( i 1, , k; j 1,<br />
, ni).<br />
Come si vede le medie interclasse ˆ i sono diverse tra loro e diverse dalla media di<br />
popolazione<br />
k ni xij, n<br />
k<br />
ni, ˆi<br />
ni<br />
xij<br />
i1 j1 i1 i j1<br />
1 1<br />
<br />
n n<br />
Vogliamo stabilire se questa variabilità è da attribuirsi al caso oppure è qualcosa di sistematico.<br />
Nell'ipotesi che la popolazione di dati possa ritenersi omoschedastica con distribuzione gaussiana,<br />
rappresentiamo il generico dato x ij nel seguente modo<br />
x a y<br />
ij i ij<br />
dove i a modella l’effetto della classe i-esima e y ij è una fluttuazione statistica che modelliamo<br />
come una gaussiana con media nulla e varianza<br />
2<br />
costante per tutte le classi; risulta che x ij è<br />
modellata come una gaussiana con media i i a<br />
2<br />
e varianza .<br />
A questo punto si vuole testare l’ipotesi composta<br />
0<br />
H : ai 0 per ogni i<br />
cioè che la differenza interclasse è da attribuirsi al caso, contro l’ipotesi alternativa<br />
H : ai 0 per almeno un i<br />
1
che tale differenza sia dovuta ad un fattore sistematico.<br />
Consideriamo la varianza campionaria totale<br />
k ni 2 k ni<br />
2 k<br />
2<br />
1 1 1<br />
n<br />
<br />
n<br />
<br />
n<br />
xij ˆ xij ˆ i ni<br />
ˆ i ˆ <br />
<br />
i1 j1 i1 j1 <br />
i1<br />
T V<br />
che con semplici passaggi può decomporsi nelle due varianze parziali V e W : la prima rappresenta<br />
la variabilità intraclasse, cioè la variabilità dei dati all’interno di ciascun gruppo di ni termini che è<br />
la stessa indipendentemente dal fatto che l’ipotesi H0 sia vera o falsa; la seconda fornisce la<br />
variabilità interclasse e, se l’ipotesi H0 è vera, risulta essere una fluttuazione casuale, altrimenti<br />
porta in conto la variabilità dovuta alle differenze tra le medie dei vari sottogruppi.<br />
Ora se l’ipotesi H0 è vera, la variabile T / risulta essere distribuita come una<br />
2<br />
W<br />
51<br />
2<br />
con<br />
n 1 gradi di libertà. In base al teorema di Cochran si può quindi dimostrare che V / è distribuita<br />
come una 2<br />
2<br />
con n k gradi di libertà, mentre W / ha distribuzione 2<br />
con k 1 gradi di<br />
libertà; inoltre V e W sono tra loro indipendenti. Quindi il rapporto<br />
W /( k1)<br />
F <br />
V /( nk) ha distribuzione di Fisher con 1 k1, 2 n k gradi di libertà. Se W è troppo grande<br />
dovremmo rifiutare H 0 ; fissando un livello di significatività del test pari ad , ovvero fissando la<br />
probabilità di commettere l’errore di tipo I rifiutando H0 quando è vera, dalle tavole della<br />
distribuzione F 1, si ricava il percentile F<br />
2<br />
per cui se<br />
F F si rifiuta H0 prendendo la decisione giusta nell’ (1 )% dei casi. Il terst appena anlizzato prende<br />
comunemente il nome di F-test.<br />
L’analisi svolta viene normalmente riportata su una tabella che viene detta appunto tabella<br />
dell’analisi della varianza<br />
variazione gradi di libertà<br />
somme<br />
quadrati<br />
dei<br />
devianze statistiche<br />
Tra gruppi<br />
Nei gruppi<br />
k-1<br />
n-k<br />
W<br />
V<br />
W/(k-1)<br />
V/(n-k)<br />
W /( k1)<br />
;<br />
V /( nk) Totale n-1 T<br />
z ln F<br />
che nel nostro caso diventa<br />
2
52<br />
variazione gradi di libertà<br />
Somme<br />
quadrati<br />
dei<br />
devianze statistiche<br />
Tra gruppi<br />
Nei gruppi<br />
Totale<br />
3<br />
36<br />
39<br />
2620<br />
6496<br />
9116<br />
873.33<br />
183.22<br />
F = 4.84;<br />
z = 0.79<br />
Se si sceglie 0.05 dalle tavole si ricava F 2.90 ; per cui dato che 4.84>2.90 dobbiamo<br />
rifiutare l’ipotesi che la differenza tra le medie degli scambi giornalieri dei 4 prodotti finanziari sia<br />
dovuta al caso.<br />
Lo stesso tipo di analisi può essere condotta se la misura della grandezza di interesse x è<br />
influenzata da più di un attributo. In riferimento al caso già trattato supponiamo di considerare il<br />
( )<br />
numero di scambi giornalieri di k titoli in h mercati; per cui ora xij denota la -esima rilevazione<br />
del numero di scambi giornalieri del titolo i -esimo nel mercato j -esimo.<br />
Ora, il generico dato può essere rappresentato nel seguente modo<br />
( ) ( )<br />
ij i j ij ij<br />
x a b y<br />
Senza perdita di generalità, per semplificare le notazioni, si assume che ciascuna classe sia<br />
composta dallo stesso numero di elementi, per cui 1 m per ogni i, j. La costante ij modella<br />
l'effetto combinato dei due attributi, e la variabile<br />
dato e si assume con distribuzione<br />
Siano ora<br />
2<br />
N(0, ) .<br />
( )<br />
yij modella al solito la variabilità statistica del<br />
1 h m<br />
( ) 1 h m<br />
( ) 1 m<br />
( )<br />
i,.,. xij , ., j,. xij , ij xij<br />
hm j11 km i11<br />
m1<br />
ˆ ˆ ˆ <br />
la media dei dati per il valore i-esimo del primo attributo, la media dei dati per il valore j-esimo del<br />
secondo attributo, la media dei dati all'interno di ciascun gruppo individuato dalla generica coppia<br />
di valori i, j del primo e del secondo attributo. La variabilità totale T dei dati può essere questa<br />
volta decomposta nel seguente modo<br />
( ) ( )<br />
2<br />
xij ˆ xij ˆ ij hm ˆ i,.,. ˆ km ˆ ., j,.<br />
ˆ <br />
k h m 2 k h m 2 k h<br />
2<br />
<br />
i1 j11 i1 j11 i1 j1<br />
k h<br />
2<br />
m ˆ ij ˆ i,.,. ˆ ., j,. ˆ <br />
V W1W2WI i1 j1<br />
Il primo termine a secondo membro V rappresenta la variabilità statistica dei dati all'interno di<br />
ciascun gruppo ed è indipendente dalla presenza degli effetti degli attributi; esso costituisce il
termine di errore. Il secondo termine W 1 ed il terzo W 2 rappresentano la variabilità dovuta<br />
all'effetto del primo attributo ed all'effetto del secondo attributo, rispettivamente. Il termine<br />
W viene detto interazione e quantifica l'effetto legato alla sinergia degli attributi. L'ipotesi nulla<br />
I<br />
H richiede che tutte le costanti a , b , siano nulle. Se questo è vero, con l'ipotesi di gaussianità<br />
0<br />
i j ij<br />
dei dati, si ha al solito che T / è distribuita come una<br />
2<br />
2<br />
con 1<br />
V<br />
2<br />
W1 2<br />
W2 2<br />
W<br />
2<br />
53<br />
khm gradi di libertà. Si può<br />
quindi applicare il teorema di Cochran ed affermare che , , , I sono<br />
2<br />
variabili aleatorie indipendenti con distribuzione con gradi di libertà khm 1,<br />
k 1,<br />
h 1<br />
e k1h 1<br />
rispettivamente. A questo punto si possono testare varie ipotesi: se si vuole valutare<br />
l'importanza del primo attributo si considera la variabile<br />
<br />
<br />
W1/ k 1<br />
F1<br />
<br />
V / kh m 1<br />
che risulta avere distribuzione di Fisher con k 1, khm 1<br />
gradi di libertà. Fissando al solito il<br />
livello % di significatività del test è possibile rilevare sulle tabelle opportune il relativo percentile<br />
F1, ; se il valore F 1 ottenuto dai dati dell'esperimento supera F1, si deve ritenere che l'effetto del<br />
primo attributo introduce una variabilità sistematica nei dati, non attribuibile a cause aleatorie, e<br />
quindi ha senso stratificare i dati in base ai valori del primo attributo. Lo stesso ragionamento vale<br />
per il secondo attributo; si consideri la variabile<br />
F<br />
2<br />
<br />
<br />
W2/ h 1<br />
<br />
V / kh m 1<br />
che ha distribuzione di Fisher con h 1, khm 1<br />
gradi di libertà. Si scelga il livello % di<br />
significatività del test e si determini il percentile F2, dalle tabelle. I valori del secondo attributo<br />
inducono una stratificazione significativa dei dati se F2 F2, .<br />
Infine il grado di interazione fra gli attributi può essere valutato considerando la variabile<br />
F<br />
I<br />
<br />
/ 1<br />
WI/ k 1 h 1<br />
<br />
V kh m<br />
che ha distribuzione di Fisher con k 1h 1 , khm 1<br />
gradi di libertà. Scelto il livello % di<br />
significatività del test e determinato il percentile FI , dalle tabelle, se risulta FI FI, dovremo<br />
ritenere che l'effetto combinato dei due attributi è significativo ai fini di una stratificazione della<br />
popolazione. La popolazione risulta essere omogenea se in tutti e tre i test precedenti le statistiche<br />
F, F e F I ottenute dai dati non superano i rispettivi percentili.<br />
1 2<br />
Nel caso particolare in cui m 1,<br />
per cui è disponibile una sola rilevazione xij della variabile x per<br />
ogni coppia di valori (, i j) dei due attributi, non è possibile modellare il grado di interazione tra gli<br />
attributi. Per cui si avrà la seguente rappresentazione del dato generico
54<br />
xij aibj yij<br />
dove, nelle stesse ipotesi del caso con interazione, ai è una costante che tiene conto dell’effetto<br />
dell’attributo “titolo”, bj è una costante che tiene conto dell’effetto dell’attributo “mercato”, e<br />
ij<br />
2 0 y N , . In questa situazione le grandezze<br />
h k k h<br />
1 1 1<br />
i,. x ij , ., j x ij , xij<br />
h j1 k i1 hk i1 j1<br />
ˆ ˆ ˆ <br />
denotano la media degli scambi giornalieri del titolo i -esimo sull’insieme dei mercati, la media<br />
degli scambi giornalieri dell’insieme di titoli nel mercato j -esimo e la media degli scambi<br />
giornalieri di titoli sull’insieme dei mercati, rispettivamente.<br />
La variabilità totale dei dati risulterà quindi ripartita nel seguente modo<br />
2<br />
xij ˆ ˆ i,. ˆ ˆ ., j ˆ xij ˆ i,. ˆ ., j ˆ <br />
k h 2 k h k h 2 k h<br />
2<br />
<br />
i1 j1 i1 j1 i1 j1 i1 j1<br />
k h 2 k h<br />
2<br />
2<br />
i,. ˆ ˆ ., j ˆ ij ˆ i,. ˆ ., j ˆ <br />
<br />
h k x <br />
i1 j1 i1 j1<br />
W W V<br />
1 2<br />
Il primo termine a secondo membro è la variabilità tra i vari titoli, il secondo è la variabilità tra i<br />
mercati, ed il terzo termine è detto comunemente termine di errore. Con ragionamenti analoghi al<br />
caso precedente, a norma del teorema di Cochran, possiamo affermare che i tre termini a secondo<br />
2<br />
2<br />
membro sono indipendenti; inoltre W è distribuita come una con k 1gradi<br />
di libertà,<br />
2<br />
2<br />
1<br />
2<br />
con<br />
W2 è distribuita come una con h 1<br />
gradi di libertà e V è distribuita come una<br />
h1k 1<br />
gradi di libertà.<br />
A questo punto possiamo testare varie ipotesi; per esempio se vogliamo testare se l’effetto della<br />
variabilità dovuta ai titoli è significativo basta considerare la variabile<br />
1 / 1<br />
1 1<br />
W k<br />
F1 <br />
V / h k<br />
che sarà distribuita come una Fisher F k1, h1k1. Se invece vogliamo testare per la significatività<br />
dell’effetto legato ai mercati possiamo considerare la variabile<br />
F<br />
2<br />
2 / 1<br />
1 1<br />
W h<br />
<br />
V / h k
che sarà distribuita come una Fisher F h1, h1k1. adhf primer method<br />
1 4.0 1 D<br />
2 4.5 1 D<br />
3 4.3 1 D<br />
4 5.6 2 D<br />
5 4.9 2 D<br />
6 5.4 2 D<br />
7 3.8 3 D<br />
8 3.7 3 D<br />
9 4.0 3 D<br />
10 5.4 1 S<br />
11 4.9 1 S<br />
12 5.6 1 S<br />
13 5.8 2 S<br />
14 6.1 2 S<br />
15 6.3 2 S<br />
16 5.5 3 S<br />
17 5.0 3 S<br />
18 5.0 3 S<br />
<br />
Esaminiamo il seguente caso. Tre tipi di fondo per vernici<br />
(primer) sono applicatio su alluminio in due modi: immersione<br />
(dipping, D), a spruzzo (spraying, S). L'esperimento consiste nel<br />
determinare la forza di adesione della vernice (adhf)<br />
dipendentemente dal fondo e dal metodo utilizzati. In base ai<br />
valori della tabella valutiamo se la forza di adesione risente<br />
singolarmente del primer e del metodo di applicazione, o risente<br />
del loro effetto combinato. I dati dell'esperimento sono riportati<br />
nella tabella accanto: si ha un totale di 18 misure: per ogni primer<br />
si hanno tre ripetute per il metodo dipping e tre ripetute per lo<br />
spraying. La forza di aderenza della vernice dipende da due<br />
attributi : il "metodo di deposizione del primer", attributo con<br />
k 2 valori "D" e "S"; il "tipo di primer " con h 3 valori "tipo<br />
1", "tipo 2" e "tipo 3". Gli attributi determinano un totale di<br />
k* h 6 gruppi, ciascuno con m 3 ripetute<br />
Probability<br />
notiamo in effetti che la media dei 0.10<br />
dati<br />
0.05<br />
0.02<br />
Normal Probability Plot<br />
( )<br />
xij , i 1,2 j 1,2,3 1,2,3<br />
0.98<br />
Verifichiamo l'applicabilità del test 0.95<br />
ANOVA a 2 vie descritto. Il valor 0.90<br />
medio campionario dei dati è pari a<br />
4.9889, mentre la deviazione 0.75<br />
standard stimata, nell'ipotesi che il<br />
campione sia casuale, è pari a 0.50<br />
0.2070. I dati sono valori positivi, ci<br />
chiediamo quanto sia verosimile 0.25<br />
testare un'ipotesi di gaussianità:<br />
dista dallo 0 per più di 4, per la<br />
distribuzione gaussiana può essere un<br />
buon modello di distribuzione dei dati, in<br />
4 4.5 5<br />
Data<br />
5.5 6<br />
quanto prevede che l'insieme dei valori negativi ha una probabilità di occorrere<br />
inferiore a 0.006. Analizziamo il Q-Q plot. Dalla figura accanto si nota un certo allineamento tra i<br />
quantili: il test di Lilliefors (Matlab) suggerisce che il rifiuto dell'ipotesi nulla che la distribuzione<br />
dei dati sia gaussiana ha un rischio (p_value) pari a 0.4233>>0.05, per cui l'ipotesi nulla va<br />
accettata, ed i dati sono ritenersi estratti da una distribuzione gaussiana. Verifichiamo ora<br />
l'omoschedasticità dei dati (ipotesi nulla): il test di Bartlett garantisce che non ci sia differenza<br />
significativa tra le varianze dei gruppi, con un p_value pari a 0.9214. Siamo quindi nelle condizioni<br />
di applicazione del test ANOVA di Pearson.<br />
Ripartiamo quindi la variabilità totale dei dati nel modo visto<br />
( ) ( )<br />
2<br />
ij ˆ ij ˆ ij 9 ˆ i,.,. ˆ 6 ˆ ., j,.<br />
ˆ <br />
2 3 3 2 2 3 3 2 2 3<br />
2<br />
<br />
T x x <br />
i1 j11 i1 j11 i1 j1<br />
2 3 2<br />
3 ˆ ij ˆ i,.,. ˆ ., j,. ˆ <br />
V W1W2WI i1 j1<br />
55
56<br />
1 3 3 3 3<br />
( ) 1 ( )<br />
1,.,. 1j 2,.,. 2j<br />
9 j11 9 j11<br />
ˆ x 4.4667, ˆ x 5.5111<br />
methods<br />
1 2 3 2 3 2 3<br />
( ) 1 ( ) 1 ( )<br />
.,1,. i1 .,2,. i2 .,3,. i3<br />
6 i11 6 i11 6 i11<br />
ˆ x 4.7833, ˆ x 5.6833 ˆ x 4.5<br />
primers<br />
11<br />
1 3<br />
( ) x11 31 12<br />
1 3<br />
( ) x12 31 13<br />
1 3<br />
( )<br />
x13<br />
31<br />
21<br />
1 3<br />
( ) x21 31 22<br />
1 3<br />
( ) x22 31 23<br />
1 3<br />
( )<br />
x23<br />
31<br />
ˆ 4.2667, ˆ 5.3, ˆ 3.8333,<br />
ˆ 5.3, ˆ 6.0667 ˆ 5.1667<br />
2 3 3<br />
( )<br />
xij<br />
i1 j11<br />
1<br />
4.9889<br />
18<br />
Si ottiene<br />
T 10.7178, V 0.9867, W14.9089, W24.5811, WI 0.2411<br />
I dati sono gaussiani e omoschedastici, per cui sotto l'ipotesi nulla<br />
H : a a 0, b b 0, 0<br />
0 1 2 1 2 11 12 21 22<br />
T<br />
2<br />
ha distribuzione 17 ; il teroema di Cochran assicura quindi che le variabili<br />
la variabile 2<br />
<br />
VW , 1, W2, WI sono<br />
2<br />
tra loro indipendenti, con gradi di libertà rispettivamente pari a 12,1,2,2.<br />
A questo punto calcoliamo le statistiche del test per la significatività dell'attributo "metodo di<br />
deposizione"<br />
dell'attributo "tipo di primer"<br />
e dell'interazione fra i due attributi<br />
W1<br />
F1<br />
59.7027<br />
V /12<br />
W 2/2<br />
F2<br />
27.8581<br />
V /12<br />
WI /2<br />
FI 1.4662<br />
V /12<br />
Fissando il livello di significatività del test pari a % 0.05,<br />
dalle tabelle della Fisher otteniamo il<br />
percentile per la F 1,12 pari a 4.75, per cui si può ritenere che il metodo di deposizione del fondo<br />
costituisca un attributo che influenza significativamente la forza di aderenza della vernice; dai
valori medi calcolati per methods si vede subito che il secondo metodo (spraying) determina una<br />
forza media (sui tre tipi di primer) di aderenza pari a 5.5111 contro 4.4667 del primo metodo<br />
(dipping). Invece il percentile per la F 2,12 pari a 3.88, per cui anche l'attributo "tipo di primer"<br />
influenza significativamente la forza di aderenza: dai valori medi calcolati per primers si nota come<br />
il secondo tipo di fondo garantisca una forza di aderenza media (sui due metodi di deposizione) pari<br />
a 5.6833, significativamente più alta rispetto agli altri due tipi di fondo, che hanno prestazioni simili<br />
di 4.7833 (tipo 1) e 4.5 (tipo 3). Questa considerazione comunque andrebbe confortata con una<br />
ulteriore analisi ponendo i dati relativi al tipo1 e tipo 3 in un unico gruppo e verificare la differenza<br />
significativa con il gruppo di dati relativi al tipo 2. Per quanto riguarda l'interazione, dato che il<br />
percentile è lo stesso che per F2, si vede come si debba escludere una sinergia tra metodo di<br />
deposizione del fondo e tipo di fondo.<br />
Per quanto riguarda la significatività dei due attributi singolarmente, avremmo potuto anche<br />
utilizzare due ANOVA ad una via. Ad esempio, per l'attributo "metodo di deposizione", avremmo<br />
raggruppato i dati in due classi: la prima per il valore "dipping" dell'attributo, aggregando i 9 dati in<br />
tabella contrassegnati con "D", relativi ai tre tipi di primer; la seconda classe relativa al valore<br />
"sparying" dell'attributo, aggregando i 9 dati in tabella contrassegnati con "S". In questo caso si<br />
sarebbe ottenuta la seguente ripartizione della variabilità dei dati<br />
( ) ( )<br />
ij ˆ ij ˆ i 9<br />
ˆ i ˆ <br />
2 3 3 2 2 3 3 2 2<br />
2<br />
<br />
T x x V W<br />
i1 j11 i1 j11 i1<br />
dove è lo stesso di prima in quanto è la media globale dei dati, mentre<br />
1 3 3 3 3<br />
( ) 1 ( )<br />
1 x1j 4.4667 1,.,. , 2 x2j<br />
5.5111 2,.,.<br />
9 j11 9 j11<br />
<br />
Si ottiene<br />
T10.7178, V 5.8089, W 4.9089<br />
Si noti come il termine W è lo stesso del termine W 1 dell'ANOVA a due vie con interazione,<br />
mentre il termine d'errore V raccolga la somma dei termini VW , 2, WI(salvo approssimazioni<br />
numeriche) della precedente analisi.<br />
Nelle stesse ipotesi statistiche abbiamo che la variabile<br />
W<br />
F 13.521<br />
V /16<br />
ha distribuzione Fisher F 1,16 il cui percentile del 5% è compreso tra 4.54 e 4.35. Per cui si deve<br />
rifiutare l'ipotesi nulla e ritenere il metodo di deposizione un fattore significativo per la forza di<br />
aderenza della vernice. Inoltre, avendo solo due gruppi, risulta immediatamente che il secondo<br />
metodo, lo spraying, ha le prestazioni migliori, garantendo una forza di adesione media (su tutti i<br />
primer) di 5.5111 contro 4.4667 del metodo dipping. Tale risultato conferma quanto ottenuto<br />
nell'ANOVA a due vie. Sulla scorta di questa osservazione eseguiamo ora un ANOVA ad una via<br />
per l'attributo "tipo di primer". Si ottengono tre classi, ognuna di 6 dati ottenuti considerando per<br />
ogni primer le 3 ripetute contrassegnate con "D" e le 3 contrassegnate con "S". Si ottiene<br />
57
58<br />
( ) ( )<br />
ij ˆ ij ˆ i 6<br />
ˆ i ˆ <br />
2 3 3 2 2 3 3 2 3<br />
2<br />
<br />
T x x V W<br />
con<br />
i1 j11 i1 j11 i1<br />
1 2 3 2 3 2 3<br />
( ) 1 ( ) 1 ( )<br />
1 xi1 4.7833 .,1,. , 2 xi2 5.6833 .,2,. , 3 xi3<br />
4.5 .,3,.<br />
6 i11 6 i11 6 i11<br />
<br />
Si ottengono quindi i seguenti valori<br />
T 10.7178, V 6.1367, W 4.5811<br />
Possiamo anche qui notare che W W2,<br />
mentre V raccoglie i termini VW , 1, WIdell'ANOVA a due<br />
vie. Osserviamo che il termine di differenza tra gruppi questa volta è più piccolo che nel caso<br />
precedente per l'attributo "metodo di deposizione ", mentre la V è più grande. Infatti risulta<br />
W /2<br />
F2<br />
5.5989<br />
V<br />
15<br />
che comunque è maggiore del percentile del 5% di una Fisher F2,15 3.68 . Per cui anche l'effetto<br />
dell'attributo " tipo di primer" è da ritenersi significativo. Tuttavia, rispetto al caso precedente, ora<br />
ci sono tre gruppi e non è chiaro come scegliere il primer migliore, in quanto il rifiuto dell'ipotesi<br />
nulla dice solo che c'è almeno un gruppo significativamente differente dagli altri. Per cui bisogna<br />
condurre un'analisi ulteriore, come si era peraltro già precisato in occasione dell'analisi ANOVA a 2<br />
vie.<br />
Analizziamo ora il caso di studio togliendo la variabilità dei dati dovuta alle tre ripetute per<br />
ogni gruppo: questo si ottiene sostituendo alle 3 ripetute la loro media ij, i 1,2 j 1,2,3.<br />
Otteniamo quindi uno schema di analisi ANOVA a 2 vie senza interazione<br />
2<br />
ˆ ij ˆ 3 ˆ i,. ˆ 2 ˆ .,jˆ ˆ ijˆ i,. ˆ .,jˆ <br />
2 3 2 2 3 2 2 3<br />
2<br />
<br />
T <br />
dove<br />
i1 j1 i1 j1 i1 j1<br />
W W V<br />
1 2<br />
1 3 1 3<br />
1,. 1j 2,. 2j<br />
3 j1 3 j1<br />
ˆ ˆ 4. 4667, ˆ ˆ 5.<br />
5111<br />
1 2 1 2 1 2<br />
., 1 i 1 ., 2 i 2 ., 3 i3<br />
2 i1 2 i1 2 i1<br />
ˆ 4. 7833, ˆ 5. 6833, ˆ ˆ 4.<br />
5<br />
Quindi si ottiene<br />
T 3.2427, V 0.0804, W 1.6363, W <br />
1.5270<br />
1 2
Notiamo subito che la variabilità totale è diminuita rispetto ai casi precedenti in quanto questa è<br />
dovuta solo alle "medie delle misure in ciascun gruppo" ij e non dalle misure<br />
precedenti. Nelle stesse ipotesi statistiche dei casi precedenti abbiamo che le variabili<br />
59<br />
( )<br />
xij , come nei casi<br />
W1 W2<br />
/2<br />
F1 40.7189, F2<br />
19<br />
V /2 V /2<br />
hanno distribuzione di Fisher F 1,2 con percentile del 5% pari 18.51, e F 2,2 con percentile del<br />
5% pari 19. Per cui, mentre per il primo l'attributo "metodo di deposizione" otteniamo dei risultati<br />
in accordo con quelli delle analisi precedenti, in quanto l'ipotesi nulla deve essere rifiutata, per il<br />
secondo attributo "tipo di primer" la situazione è un pò critica: si ottiene un valore di F2 proprio pari<br />
al percentile F2,2,0.05 19 (in effetti sarebbe F2 19.000000000000142 ). A questo punto siamo<br />
proprio sulla frontiera del set critico, potremmo senz'altro decidere comunque di rifiutare l'ipotesi<br />
nulla; sarebbe comunque più ragionevole ad esempio richiedere l'acquisizione di dati ulteriori. Ma,<br />
indipendentemente dalla decisione che prenderemo, notiamo come l'aver mediato le misure<br />
riducendo la variabilità totale dei dati abbia portato ad una situazione di indecisione. Avremmo<br />
anche potuto avere un risultato per cui, nel caso del secondo attributo, avremmo dovuto accettare<br />
l'ipotesi nulla, ottenendo un'indicazione in netto contrasto con quella delle analisi precedenti.<br />
Questo semplice caso di studio su dati reali ha mostrato che è meglio usare un modello per i<br />
dati in cui i due (o più) attributi vengono considerati contemporaneamente, conviene quindi sempre<br />
rappresentare al meglio tutte le cause di variabilità dei dati.
60<br />
Concludiamo la sezione dell'ANOVA riassumendo e discutendo le ipotesi che devono essere<br />
soddisfatte dall'insieme dei dati affinché l'F-test dia risultati attendibili<br />
1. ciascun gruppo dell'insieme deve essere un campione di dati casuale, e i dati relativi a<br />
gruppi differenti devono essere indipendenti<br />
2. i gruppi devono avere grosso modo lo stesso numero di dati<br />
3. la scala di variazione dei dati deve essere comparabile tra i diversi gruppi<br />
4. la distribuzione dei dati deve essere gaussiana<br />
5. la varianza deve essere costante<br />
Diciamo subito che l'F-test è robusto rispetto a violazioni delle condizione 4) e 5) se ogni gruppo<br />
ha un numero di dati sufficientemente grande e più o meno uguale tra loro. In caso di numero di dati<br />
basso, le differenze tra le varianze può risultare determinante.<br />
K-W ANOVA. L'algoritmo di Kruskal-Wallis è un test ANOVA non parametrico che si può<br />
applicare tutte le volte che la distribuzione dei dati differisca significativamente dalla gaussiana, pur<br />
rimanendo la stessa per tutta la popolazione, per cui deve sempre valere l'omoschedasticità. Per<br />
meglio illustrare l'algoritmo consideriamo un esempio.<br />
Un'azienda vinicola chiede a degli intenditori di testare tre dei loro vini, indichiamoli per semplicità<br />
A, B e C, con un punteggio da uno a dieci. Ecco quanto ottenuto dopo i vari assaggi (tabella di<br />
sinistra)<br />
Per prima cosa si devono ordinare i dati in ordine<br />
crescente. Nella tabella quindi ad ogni dato viene<br />
sostituito il suo numero d'ordine nella lista (rank). Se due<br />
o più dati dovessero avere lo stesso valore e quindi<br />
occupare lo stesso rank, questo viene ripartito in parti<br />
uguali in modo da non privilegiare nessun gruppo<br />
(adjusted ranks). Nel caso in esame si ottiene la tabella di<br />
destra.<br />
Ora l'ipotesi nulla consiste nel testare che i valori medi<br />
dei ranghi dei tre gruppi siano uguali, contro l'ipotesi<br />
alternativa che almeno due di essi differiscano. Siano al solito n1, n2, n 3 il numero di dati per<br />
ciascun gruppo, e si indichino con r1, r2, r3<br />
i valori medi dei ranghi nei tre gruppi, mentre sia<br />
la media dei ranghi per tutto l'insieme di dati. La statistica del test è data dalla seguente variabile<br />
r<br />
3<br />
<br />
ˆ ˆ <br />
ni<br />
ri r<br />
i1<br />
H <br />
1<br />
NN 1<br />
12<br />
dove al solito N è il numero totali di dati. Questa risulta essere distribuita approssimativamente<br />
2 2<br />
come una 31 2<br />
(chi-quadro a 2 gradi di libertà ). Il percentile del 5% di tale distribuzione è<br />
pari a 5.991. Per cui il set critico del test di livello 5% è data da<br />
2
H 5.991<br />
Nel caso in esame si ottiene H 9.5591,<br />
per cui si deve rifiutare l'ipotesi nulla e ritenere che i<br />
gruppi abbiano ranghi con medie significativamente differenti; si noti in particolare come i ranghi<br />
corrispondenti al vino A siano più elevati rispetto agli altri due vini, per cui possiamo senz'altro<br />
concludere che il vino A abbia riscosso maggior successo tra gli intenditori.<br />
Il test K-W da buoni risultati se le la distribuzione dei dati ha la stessa forma per tutti i gruppi e le<br />
varianze sono sostanzialmente uguali, già con 5 dati per ogni gruppo. Generalmente si assegna<br />
come regola che la varianza più grande sia non più del doppio della varianza più piccola.<br />
Se tuttavia i dati avessero la stessa distribuzione ma soffrissero di una forte eteroschedasticità, il test<br />
K-W non è affidabile. In caso che la distribuzione sia gaussiana si può ricorrere al seguente test.<br />
Welch ANOVA. Con il solito significato dei simboli, facciamo riferimento ad un insieme di dati con<br />
k gruppi; la distribuzione sia gaussiana ma le varianze dei gruppi differiscano significativamente.<br />
In queste condizioni il valor medio di popolazione si calcoli con la seguente media pesata<br />
k<br />
wi<br />
ˆ i<br />
k<br />
i1ni wi w<br />
2 wi<br />
w sn<br />
i1<br />
ˆ <br />
, , <br />
dove al solito le 2<br />
s n sono le varianze campionarie di ciascun gruppo. La statistica del test è data<br />
i<br />
dalla seguente variabile<br />
k<br />
<br />
i1<br />
w ( ˆ ˆ )<br />
i i<br />
W <br />
k 1<br />
2( k 2) k 1 <br />
w<br />
1 1 i <br />
<br />
2 <br />
<br />
k 1 i1<br />
ni1w <br />
<br />
<br />
che risulta essere distribuita come una chi-quadro con un numero di gradi di libertà dato da<br />
k 1<br />
k 1 w<br />
3 1 i <br />
<br />
<br />
i1<br />
ni1w <br />
<br />
<br />
Come al solito si prende il valore intero più vicino.<br />
2<br />
i<br />
2<br />
2<br />
2<br />
61
62<br />
Piano degli esperimenti<br />
Come abbiamo visto, l’analisi della varianza permette di testare ipotesi composte nella stima<br />
del valor medio di una popolazione. Nel caso quindi che l’ipotesi H0 debba essere rifiutata significa<br />
sostanzialmente che l’insieme di dati non è omogeneo statisticamente; quindi se nella stima del<br />
valor medio di insieme il campione di n dati non venga opportunamente stratificato tra le varie<br />
classi dell’insieme, ne risulterebbe una stima affetta da grande variabilità, e quindi poco affidabile.<br />
Questo può essere facilmente compreso se consideriamo il caso in cui gran parte dei dati del<br />
campione cadano in una sola delle classi; questo darebbe luogo ad una stima del valor medio<br />
d’insieme fortemente polarizzata dalle caratteristiche statistiche della classe suddetta.<br />
Nasce quindi l’esigenza di pianificare l’esperimento in modo da raccogliere i dati<br />
distribuendo opportunamente la numerosità del campione tra le varie classi o strati; questa tecnica<br />
prende il nome di stratificazione (o clusterizzazione). La situazione generale è quindi quella di un<br />
insieme di N elementi suddivisi in k strati ognuno con i N unità. Sia i il valor medio di un certo<br />
attributo degli elementi considerati nella classe i-esima, e sia wi Ni / N il peso della classe i-esima<br />
nell’insieme, che supponiamo noto perché, ad esempio, ottenuto da una precedente indagine<br />
sperimentale condotta ad hoc. Come è facile verificare per il valore medio di insieme si ha<br />
k<br />
wii<br />
i1<br />
Ora consideriamo ni elementi per ogni strato e stimiamo i con la media campionaria ˆ n . Come<br />
i<br />
sappiamo questa è una stima centrata E ˆ <br />
n <br />
i ie,<br />
nel caso realistico di estrazione in blocco<br />
senza reinserzione, con varianza<br />
<br />
2<br />
2 Ni ni<br />
i<br />
ˆ <br />
ni<br />
Ni 1<br />
ni<br />
mentre nel caso sia possibile l’estrazione di un campione indipendente si otterrebbe<br />
2 <br />
ˆ <br />
ni<br />
n<br />
2<br />
dove i è la varianza intraclasse dell’attributo considerato, ed è inferiore alla varianza 2<br />
di<br />
popolazione se, ovviamente, la stratificazione è stata eseguita opportunamente! La stima ˆ n della<br />
media di popolazione è quindi data da<br />
2<br />
i<br />
i<br />
k<br />
ˆn wi<br />
ˆni i1<br />
<br />
che è centrata come è facile verificare; inoltre ritenendo che il campione preso da uno strato sia<br />
indipendente da quelli presi dagli altri, la varianza di ˆ n è data da
k 2<br />
2 i<br />
wi camp. indp.<br />
k i1<br />
ni<br />
2 2 2 <br />
ˆ w<br />
i<br />
n ˆ n<br />
i1 i k<br />
2<br />
2 Ni n<br />
w i i<br />
i<br />
camp. non indp.<br />
i1<br />
Ni 1<br />
ni<br />
<br />
2<br />
dove i può essere a sua volta stimata nei modi indicati.<br />
Come si vede la varianza della stima dipende dagli n i , per cui una corretta scelta di essi può<br />
rendere la stima ˆ n più accurata possibile una volta fissato, per motivi di costi o altri motivi di<br />
ordine pratico, la numerosità totale n del campione. Esaminiamo due possibili strategie!<br />
1) Attribuzione proporzionale<br />
In questo caso si sceglie ni wn i (ovviamente approssimato ad un intero); per la varianza<br />
della stima otteniamo<br />
<br />
1 k<br />
2<br />
wii camp. indp.<br />
n i1<br />
2 <br />
ˆ <br />
<br />
n<br />
<br />
1 k<br />
Ni ni<br />
2<br />
wi i<br />
camp. non indp.<br />
<br />
<br />
ni1Ni1 ed è facile dimostrare che risulta essere minore rispetto a quella ottenibile estraendo un campione<br />
casuale di dimensione n dall’intera popolazione.<br />
2) Attribuzione ottimale<br />
In questo caso si cercano i valori ottimi * ni che rendano minima la varianza<br />
<br />
con il vincolo nin . Mediante la tecnica dei moltiplicatori di Lagrange si ottiene<br />
2<br />
ˆ n<br />
63<br />
della stima,
64<br />
In effetti, nella misura in cui / 1<br />
<br />
<br />
Nii<br />
<br />
n camp. indp.<br />
k<br />
N jj j1<br />
* <br />
ni<br />
<br />
<br />
N<br />
N i<br />
i i<br />
Ni<br />
1<br />
n<br />
camp. non indp.<br />
k<br />
N j<br />
N j j<br />
j1<br />
N j 1<br />
N N 1, si può usare la stessa attribuzione ottima<br />
i i<br />
e la varianza della stima all’ottimo vale<br />
Esempio<br />
<br />
<br />
2<br />
1 k <br />
wii camp. indp.<br />
n <br />
<br />
i1<br />
2 <br />
<br />
ˆ <br />
<br />
n<br />
2<br />
<br />
2 2<br />
1 k N k<br />
i w<br />
w ii ii <br />
camp. non indp.<br />
n <br />
i1 Ni 1 <br />
i1Ni<br />
1<br />
Si vuole stimare il consumo medio giornaliero di pane in un’azienda di N 10.000 dipendenti. Se<br />
si ricorresse ad un campione casuale di n 1000 dipendenti, supponendo una varianza di<br />
2<br />
popolazione 9 , la stima campionaria ˆ n della media avrebbe varianza<br />
2<br />
2 <br />
ˆ n<br />
n<br />
9<br />
0.009<br />
1000<br />
Tendendo conto delle varie tipologie di dipendenti, si può pensare alla seguente stratificazione<br />
i strato i<br />
N i<br />
w i<br />
1 manovali 6.500 0.650 1<br />
2 operai specializzati 2.500 0.250 1.5<br />
3 impiegati 920 0.092 2<br />
4 dirigenti 80 0.008 2.5<br />
totale 10.000 1.00
Nell’ipotesi che il campionamento interclasse sia indipendente, nel caso di attribuzione<br />
proporzionale si ottiene<br />
2 2 2 2<br />
2 (0.65)1 (0.25)1.5 (0.092)2 (0.008)2.5<br />
1.6305<br />
ˆ <br />
n<br />
n n<br />
Volendo mantenere la stessa accuratezza della stima ottenuta con il campione casuale si pone<br />
1.6305<br />
0.009<br />
n<br />
da cui si ricava n 190 anziché 1000 come prima, ottenendo quindi un forte risparmio in termini di<br />
numero di rilevamenti da effettuare. L’attribuzione proporzionale sarebbe la seguente<br />
i ni<br />
1 124<br />
2 47<br />
3 17<br />
4 2<br />
totale 190<br />
Fissando definitivamente n 190 e scegliendo l’attribuzione ottima<br />
otterremmo la seguente varianza della stima<br />
i<br />
*<br />
n i<br />
1 98<br />
2 57<br />
3 29<br />
4 6<br />
totale 190<br />
2<br />
1<br />
(0.65)1 (0.25)1.5 (0.092)2 (0.008)2.5 0.00794<br />
190<br />
2<br />
ˆ <br />
<br />
n<br />
che è sensibilmente inferiore a quella ottenuta con l’attribuzione proporzionale.<br />
Svolgiamo ora la nostra indagine circa il consumo medio giornaliero di pane sulla base di un<br />
campione di 190 unità come indicato dalla nostra analisi preliminare. I dati sono N 10.000 , i<br />
valori di i N e i w della tabella precedente, ed i valori ottimi * n i appena determinati. Prelevando<br />
quindi il campione secondo la modalità prestabilita e calcolando medie e varianze campionarie si è<br />
ottenuto<br />
65
66<br />
i<br />
ˆ ni<br />
*<br />
ni<br />
n s<br />
i,1 * ni<br />
ni<br />
1<br />
ˆ <br />
1 4.3 1.2<br />
2 3.5 1.6<br />
3 2.0 2.1<br />
4 1.5 2.3<br />
Per il consumo medio giornaliero di pane per l’azienda considerata si ottiene<br />
4<br />
n wi<br />
ni<br />
i1<br />
ˆ ˆ 0.654.3 0.253.5 0.09220.0081.5 3.866<br />
La stima della varianza, con le stime delle varianze intraclasse, risulta<br />
2<br />
2 1<br />
ˆ ˆ 0.651.2 0.251.6 0.0922.10.0082.3 0.0102<br />
n<br />
190<br />
che da luogo ad una deviazione standard di 0.1010 ed un coefficiente di variazione<br />
ˆ ˆ n<br />
0.1010<br />
<br />
ˆ n 3.866<br />
denotando una stima molto precisa della media!<br />
<br />
0.026 2.6%