28.06.2014 Views

Note del corso di Analisi II (parte di calcolo delle probabilita' e ...

Note del corso di Analisi II (parte di calcolo delle probabilita' e ...

Note del corso di Analisi II (parte di calcolo delle probabilita' e ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Come si vede, lo stimatore T 2 è consistente in me<strong>di</strong>a quadratica. Per contro T 1 non è consistente in<br />

me<strong>di</strong>a quadratica. Lo stimatore T 2 è pertanto da preferirsi a T 1 , come peraltro si poteva ben intuire.<br />

Ci chie<strong>di</strong>amo ora se vi sia uno stimatore <strong>di</strong> massima verosimiglianza per θ. La densità <strong>di</strong>screta <strong>di</strong><br />

X ∼ Ber(θ) vale<br />

{<br />

θ se x = 1<br />

p X (x|θ) =<br />

∀θ ∈ [0, 1], (6.17)<br />

1 − θ se x = 0<br />

ovvero<br />

Pertanto, osservando che x 1 + ... + x n = n ¯X n ,<br />

L(θ; x 1 , ..., x n ) =<br />

p X (x|θ) = θ x (1 − θ) 1−x per x ∈ {0, 1}, ∀θ ∈ [0, 1]. (6.18)<br />

∏<br />

i=1,...,n<br />

ovvero, passando ai logaritmi,<br />

p X (x i |θ) = θ x 1<br />

(1 − θ) 1−x1 · · · θ xn (1 − θ) 1−xn = θ n ¯X n<br />

(1 − θ) n−n ¯X n<br />

,<br />

log L(θ; x 1 , ..., x n ) = n ¯X n log θ + n(1 − ¯X n ) log(1 − θ) ∀θ ∈ [0, 1].<br />

Lo stimatore <strong>di</strong> massima verosimiglianza T = T (X 1 , ..., X n ), se esiste, deve sod<strong>di</strong>sfare l’equazione<br />

(6.14):<br />

n ¯X n<br />

T − n(1 − ¯X n )<br />

= 0,<br />

1 − T<br />

e questa ha soluzione T = ¯X n . Possiamo concludere che questo è uno stimatore <strong>di</strong> massima verosimiglianza.<br />

Stime Intervallari. Data una <strong>di</strong>stribuzione <strong>di</strong> probabilità <strong>di</strong>pendente da un parametro scalare θ ∈ R<br />

incognito, invece <strong>di</strong> attribuire a θ un valore, possiamo cercare un intervallo [a, b] ⊂ R per il quale si<br />

possa confidare che contenga θ. In alternativa all’intervallo ]a, b[, possiamo determinare una semiretta<br />

]−∞, a[ oppure ]b, +∞[: si parla allora rispettivamente <strong>di</strong> stima bilatera, stima unilatera sinistra, stima<br />

unilatera destra. 46 (Potremmo riunire questi tre casi in uno solo <strong>del</strong>la forma ]a, b[, se consentissimo<br />

ad a, b <strong>di</strong> assumere anche i valori ±∞.)<br />

Fissiamo un α ∈ ]0, 1[ (tipicamente α = 0.05, o anche α = 0.01, o più raramente α = 0.001), 47 ed<br />

un intero n, che rappresenterà l’ampiezza <strong>del</strong> campione. Nel caso <strong>del</strong>la stima bilatera, si <strong>di</strong>ce che due<br />

statistiche θ 1 , θ 2 : R n → R definiscono una stima intervallare ]θ 1 (X 1 , ..., X n ), θ 2 (X 1 , ..., X n )[ per θ al<br />

livello <strong>di</strong> confidenza 1 − α se<br />

P θ (θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n )) = 1 − α. (6.19)<br />

Questo corrisponde al taglio <strong>di</strong> due code, ovvero <strong>di</strong> ] − ∞, θ 1 (X 1 , ..., X n )] ∪ [θ 2 (X 1 , ..., X n ), +∞[.<br />

Questo significa che, se si potesse ripetere un gran numero <strong>di</strong> volte il campionamento (x 1 , ..., x n )<br />

che ha dato luogo alla stima intervallare, la percentuale dei casi in cui θ 1 (x 1 , ..., x n ) < θ < θ 2 (x 1 , ..., x n )<br />

dovrebbe essere vicina a 1 − α. Si usa allora <strong>di</strong>re che 48<br />

θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n ) con livello <strong>di</strong> confidenza 1 − α.<br />

Si vede facilmente che, per ogni livello <strong>di</strong> confidenza 1 − α, esistono infinite statistiche θ 1 , θ 2 tali<br />

che P θ (θ 1 < θ < θ 2 ) = 1 − α. Infatti, per ogni θ 1 ∈ R abbastanza piccolo, esiste un θ 2 ∈ R tale che<br />

46 Le stime bilatere sono anche dette a due code, e quelle unilatere ad una coda, per ovvi motivi.<br />

47 Tra<strong>di</strong>zionalmente, si preferisce usare la notazione 1 − α con α piccolo, piuttosto che l’equivalente β = 1 − α con β<br />

vicino a 1.<br />

48 Perché usiamo il termine “livello <strong>di</strong> confidenza” piuttosto che quello <strong>di</strong> probabilità? Perché, θ non è una variabile<br />

aleatoria, in quanto Θ non è stato dotato <strong>di</strong> una misura <strong>di</strong> probabilità. Una volta eseguito il campionamento (ovvero<br />

fissato un ω ∈ Ω e trovato x 1 = X 1(ω), ..., x n = X n(ω)), risulta determinato ¯θ i(ω) := θ i(x 1, ..., x n) per i = 1, 2; quin<strong>di</strong><br />

{¯θ 1(ω) < θ < ¯θ 2(ω)} non è un evento. Pertanto non ha senso scrivere P θ (¯θ 1(ω) < θ < ¯θ 2(ω)) per un ω fissato.<br />

29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!