Note del corso di Analisi II (parte di calcolo delle probabilita' e ...
Note del corso di Analisi II (parte di calcolo delle probabilita' e ...
Note del corso di Analisi II (parte di calcolo delle probabilita' e ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Come si vede, lo stimatore T 2 è consistente in me<strong>di</strong>a quadratica. Per contro T 1 non è consistente in<br />
me<strong>di</strong>a quadratica. Lo stimatore T 2 è pertanto da preferirsi a T 1 , come peraltro si poteva ben intuire.<br />
Ci chie<strong>di</strong>amo ora se vi sia uno stimatore <strong>di</strong> massima verosimiglianza per θ. La densità <strong>di</strong>screta <strong>di</strong><br />
X ∼ Ber(θ) vale<br />
{<br />
θ se x = 1<br />
p X (x|θ) =<br />
∀θ ∈ [0, 1], (6.17)<br />
1 − θ se x = 0<br />
ovvero<br />
Pertanto, osservando che x 1 + ... + x n = n ¯X n ,<br />
L(θ; x 1 , ..., x n ) =<br />
p X (x|θ) = θ x (1 − θ) 1−x per x ∈ {0, 1}, ∀θ ∈ [0, 1]. (6.18)<br />
∏<br />
i=1,...,n<br />
ovvero, passando ai logaritmi,<br />
p X (x i |θ) = θ x 1<br />
(1 − θ) 1−x1 · · · θ xn (1 − θ) 1−xn = θ n ¯X n<br />
(1 − θ) n−n ¯X n<br />
,<br />
log L(θ; x 1 , ..., x n ) = n ¯X n log θ + n(1 − ¯X n ) log(1 − θ) ∀θ ∈ [0, 1].<br />
Lo stimatore <strong>di</strong> massima verosimiglianza T = T (X 1 , ..., X n ), se esiste, deve sod<strong>di</strong>sfare l’equazione<br />
(6.14):<br />
n ¯X n<br />
T − n(1 − ¯X n )<br />
= 0,<br />
1 − T<br />
e questa ha soluzione T = ¯X n . Possiamo concludere che questo è uno stimatore <strong>di</strong> massima verosimiglianza.<br />
Stime Intervallari. Data una <strong>di</strong>stribuzione <strong>di</strong> probabilità <strong>di</strong>pendente da un parametro scalare θ ∈ R<br />
incognito, invece <strong>di</strong> attribuire a θ un valore, possiamo cercare un intervallo [a, b] ⊂ R per il quale si<br />
possa confidare che contenga θ. In alternativa all’intervallo ]a, b[, possiamo determinare una semiretta<br />
]−∞, a[ oppure ]b, +∞[: si parla allora rispettivamente <strong>di</strong> stima bilatera, stima unilatera sinistra, stima<br />
unilatera destra. 46 (Potremmo riunire questi tre casi in uno solo <strong>del</strong>la forma ]a, b[, se consentissimo<br />
ad a, b <strong>di</strong> assumere anche i valori ±∞.)<br />
Fissiamo un α ∈ ]0, 1[ (tipicamente α = 0.05, o anche α = 0.01, o più raramente α = 0.001), 47 ed<br />
un intero n, che rappresenterà l’ampiezza <strong>del</strong> campione. Nel caso <strong>del</strong>la stima bilatera, si <strong>di</strong>ce che due<br />
statistiche θ 1 , θ 2 : R n → R definiscono una stima intervallare ]θ 1 (X 1 , ..., X n ), θ 2 (X 1 , ..., X n )[ per θ al<br />
livello <strong>di</strong> confidenza 1 − α se<br />
P θ (θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n )) = 1 − α. (6.19)<br />
Questo corrisponde al taglio <strong>di</strong> due code, ovvero <strong>di</strong> ] − ∞, θ 1 (X 1 , ..., X n )] ∪ [θ 2 (X 1 , ..., X n ), +∞[.<br />
Questo significa che, se si potesse ripetere un gran numero <strong>di</strong> volte il campionamento (x 1 , ..., x n )<br />
che ha dato luogo alla stima intervallare, la percentuale dei casi in cui θ 1 (x 1 , ..., x n ) < θ < θ 2 (x 1 , ..., x n )<br />
dovrebbe essere vicina a 1 − α. Si usa allora <strong>di</strong>re che 48<br />
θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n ) con livello <strong>di</strong> confidenza 1 − α.<br />
Si vede facilmente che, per ogni livello <strong>di</strong> confidenza 1 − α, esistono infinite statistiche θ 1 , θ 2 tali<br />
che P θ (θ 1 < θ < θ 2 ) = 1 − α. Infatti, per ogni θ 1 ∈ R abbastanza piccolo, esiste un θ 2 ∈ R tale che<br />
46 Le stime bilatere sono anche dette a due code, e quelle unilatere ad una coda, per ovvi motivi.<br />
47 Tra<strong>di</strong>zionalmente, si preferisce usare la notazione 1 − α con α piccolo, piuttosto che l’equivalente β = 1 − α con β<br />
vicino a 1.<br />
48 Perché usiamo il termine “livello <strong>di</strong> confidenza” piuttosto che quello <strong>di</strong> probabilità? Perché, θ non è una variabile<br />
aleatoria, in quanto Θ non è stato dotato <strong>di</strong> una misura <strong>di</strong> probabilità. Una volta eseguito il campionamento (ovvero<br />
fissato un ω ∈ Ω e trovato x 1 = X 1(ω), ..., x n = X n(ω)), risulta determinato ¯θ i(ω) := θ i(x 1, ..., x n) per i = 1, 2; quin<strong>di</strong><br />
{¯θ 1(ω) < θ < ¯θ 2(ω)} non è un evento. Pertanto non ha senso scrivere P θ (¯θ 1(ω) < θ < ¯θ 2(ω)) per un ω fissato.<br />
29