Note del corso di Analisi II (parte di calcolo delle probabilita' e ...

More documents

Recommendations

Info

modelli statistici alternativi, ciascuno con la sua distribuzione di probabilità. Sappiamo però che A 5 ha poi vinto la lotteria. Si chiede di individuare la distribuzione di probabilità più verosimile, ovvero di congetturare chi possa essere stato il superacquirente. Mostreremo che è ragionevole rispondere che costui sia A 5 , ovvero il vincitore. Si noti la differenza tra: (i) il problema probabilistico di calcolare le probabilità di vittoria di ciascun partecipante, sapendo quale è il superacquirente, (ii) il problema statistico di individuare il superacquirente, sapendo chi ha vinto la lotteria. Entrambi i problemi ammettono una soluzione rigorosa, che però fornisce solo un risultato probabilistico, ovvero fornisce un risultato espresso in termini di probabilità. Ciascuno dei 10 partecipanti A 1 , ..., A 10 può essere il superacquirente. In modo più formale, posto Θ := {1, ..., 10}, ad ogni θ ∈ Θ associamo il modello statistico M θ : “A θ ha acquistato 11 biglietti, gli altri ne hanno acquistati 9”. Ciascun M θ individua la distribuzione di probabilità definita come segue: posto p(i|θ) := “probabilità di vittoria di A i condizionata dal fatto che A θ sia il superacquirente”, p(i|θ) = 11/20 per i = θ, p(i|θ) = 1/20 per i ≠ θ. (6.15) (Si noti che la dipendenza dal parametro θ è rappresentata usando la notazione tipica del condizionamento probabilistico.) La funzione di verosimiglianza L(θ, i) := p(i|θ) è quindi L(θ, i) = 11/20 per θ = i, L(θ, i) = 1/20 per θ ≠ i. (6.16) Pertanto L(·, i) è massimizzata per θ = i, ovvero attribuendo l’acquisto di 11 biglietti al vincitore. 44 Quanto è plausibile questa conclusione? Si noti che essa non dipende dal numero di biglietti acquistati dall’ignoto superacquirente: possiamo sostituire 11 con 100 o con 2, il risultato non cambia, anche se la conclusione è molto più plausibile nel primo caso che nel secondo. Infatti, se il superacquirente ha acquistato 100 biglietti, è alquanto verosimile che sia lui vincitore. Se invece ne ha acquistati solo 2, è più verosimile che il vincitore sia uno degli altri 9. Tuttavia, dovendo indicare il superacquirente, non si può rispondere “uno qualsiasi dei non vincitori”: dobbiamo sceglierne uno! Ed allora la scelta più ragionevole cade proprio sul vincitore (anche se è proprio quello che avremmo voluto escludere!) Un Altro Esempio. Si consideri una moneta che ignoriamo se sia equilibrata o meno; al fine di stabilirlo, 45 lanciamo la moneta n volte. L’esito del lancio i-esimo è una variabile aleatoria X avente distribuzione di Bernoulli Ber(θ), con θ ∈ Θ := [0, 1]: X = 1 se viene testa, X = 0 se viene croce. L’esito degli n lanci è quindi rappresentato da un campione aleatorio (X 1 , ..., X n ). Possiamo stimare θ mediante l’esito del primo lancio, X 1 , o più astutamente mediante la media campionaria ¯X n := 1 ∑ ni=1 n X i . Sia T 1 (X 1 , ..., X n ) := X 1 che T 2 (X 1 , ..., X n ) := ¯X n sono statistiche (che indicheremo brevemente con T 1 e T 2 ), poichè sono variabili aleatorie che dipendono solo da X 1 , ..., X n (e non da θ); possono essere considerate degli stimatori di θ, ovvero della speranza della variabili aleatorie X (∼Ber(θ)). Effettuare i lanci corrisponde a fissare un ω ∈ Ω. I valori ottenuti X 1 (ω) e ¯X n (ω) sono quindi stime di θ. Gli stimatori T 1 che T 2 sono non distorti. Gli errori quadratici medi coincidono quindi con le rispettive varianze, che sono diverse: Var θ (T 1 ) = θ(1 − θ), Var θ (T 2 ) (3.18) = 1 n Var θ(X 1 ) = 1 θ(1 − θ). n 44 Si noti la presenza di due diversi punti di vista. Dal punto di vista probabilistico, si suppone θ nota e I variabile; si usa quindi la distribuzione di probabilità data dalla (6.15). Dal punto di vista statistico, invece si suppone I nota e θ incognita; entra quindi in gioco la funzione di verosimiglianza (6.16). 45 o meglio, al fine di congetturarlo. In statistica non si perviene ad alcuna certezza circa i modelli probabilistici, pur essendo le conclusioni precise e rigorose. 28
Come si vede, lo stimatore T 2 è consistente in media quadratica. Per contro T 1 non è consistente in media quadratica. Lo stimatore T 2 è pertanto da preferirsi a T 1 , come peraltro si poteva ben intuire. Ci chiediamo ora se vi sia uno stimatore di massima verosimiglianza per θ. La densità discreta di X ∼ Ber(θ) vale { θ se x = 1 p X (x|θ) = ∀θ ∈ [0, 1], (6.17) 1 − θ se x = 0 ovvero Pertanto, osservando che x 1 + ... + x n = n ¯X n , L(θ; x 1 , ..., x n ) = p X (x|θ) = θ x (1 − θ) 1−x per x ∈ {0, 1}, ∀θ ∈ [0, 1]. (6.18) ∏ i=1,...,n ovvero, passando ai logaritmi, p X (x i |θ) = θ x 1 (1 − θ) 1−x1 · · · θ xn (1 − θ) 1−xn = θ n ¯X n (1 − θ) n−n ¯X n , log L(θ; x 1 , ..., x n ) = n ¯X n log θ + n(1 − ¯X n ) log(1 − θ) ∀θ ∈ [0, 1]. Lo stimatore di massima verosimiglianza T = T (X 1 , ..., X n ), se esiste, deve soddisfare l’equazione (6.14): n ¯X n T − n(1 − ¯X n ) = 0, 1 − T e questa ha soluzione T = ¯X n . Possiamo concludere che questo è uno stimatore di massima verosimiglianza. Stime Intervallari. Data una distribuzione di probabilità dipendente da un parametro scalare θ ∈ R incognito, invece di attribuire a θ un valore, possiamo cercare un intervallo [a, b] ⊂ R per il quale si possa confidare che contenga θ. In alternativa all’intervallo ]a, b[, possiamo determinare una semiretta ]−∞, a[ oppure ]b, +∞[: si parla allora rispettivamente di stima bilatera, stima unilatera sinistra, stima unilatera destra. 46 (Potremmo riunire questi tre casi in uno solo della forma ]a, b[, se consentissimo ad a, b di assumere anche i valori ±∞.) Fissiamo un α ∈ ]0, 1[ (tipicamente α = 0.05, o anche α = 0.01, o più raramente α = 0.001), 47 ed un intero n, che rappresenterà l’ampiezza del campione. Nel caso della stima bilatera, si dice che due statistiche θ 1 , θ 2 : R n → R definiscono una stima intervallare ]θ 1 (X 1 , ..., X n ), θ 2 (X 1 , ..., X n )[ per θ al livello di confidenza 1 − α se P θ (θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n )) = 1 − α. (6.19) Questo corrisponde al taglio di due code, ovvero di ] − ∞, θ 1 (X 1 , ..., X n )] ∪ [θ 2 (X 1 , ..., X n ), +∞[. Questo significa che, se si potesse ripetere un gran numero di volte il campionamento (x 1 , ..., x n ) che ha dato luogo alla stima intervallare, la percentuale dei casi in cui θ 1 (x 1 , ..., x n ) < θ < θ 2 (x 1 , ..., x n ) dovrebbe essere vicina a 1 − α. Si usa allora dire che 48 θ 1 (X 1 , ..., X n ) < θ < θ 2 (X 1 , ..., X n ) con livello di confidenza 1 − α. Si vede facilmente che, per ogni livello di confidenza 1 − α, esistono infinite statistiche θ 1 , θ 2 tali che P θ (θ 1 < θ < θ 2 ) = 1 − α. Infatti, per ogni θ 1 ∈ R abbastanza piccolo, esiste un θ 2 ∈ R tale che 46 Le stime bilatere sono anche dette a due code, e quelle unilatere ad una coda, per ovvi motivi. 47 Tradizionalmente, si preferisce usare la notazione 1 − α con α piccolo, piuttosto che l’equivalente β = 1 − α con β vicino a 1. 48 Perché usiamo il termine “livello di confidenza” piuttosto che quello di probabilità? Perché, θ non è una variabile aleatoria, in quanto Θ non è stato dotato di una misura di probabilità. Una volta eseguito il campionamento (ovvero fissato un ω ∈ Ω e trovato x 1 = X 1(ω), ..., x n = X n(ω)), risulta determinato ¯θ i(ω) := θ i(x 1, ..., x n) per i = 1, 2; quindi {¯θ 1(ω) < θ < ¯θ 2(ω)} non è un evento. Pertanto non ha senso scrivere P θ (¯θ 1(ω) < θ < ¯θ 2(ω)) per un ω fissato. 29
Page 1 and 2: Note di Probabilità e Statistica p
Page 3 and 4: • Due Modi di Sommare. Sia {x i }
Page 5 and 6: (i) La teoria classica avviata alla
Page 7 and 8: • La Formula di Bayes. Questa pog
Page 9 and 10: quindi X(ω i ) = y j , ovvero ω i
Page 11 and 12: Quindi per la densità p f(X) abbia
Page 13 and 14: dimostrazione, questo poggia sull
Page 15 and 16: Questo teorema permette di approssi
Page 17 and 18: 4 Variabili aleatorie continue •
Page 19 and 20: La funzione ˜h può essere definit
Page 21 and 22: (ii) Legge geometrica ⇒ legge esp
Page 23 and 24: questa è una forma indeterminata d
Page 25 and 26: Θ → R, si dice stimatore di f(θ
Page 27: Se invece σ non è nota, sostituen
Page 31 and 32: Questo significa che, osservato un
Page 33 and 34: 54 Analogamente, si mette un farmac
Page 35 and 36: Infine, ricordiamo che per α fissa
Page 37 and 38: Questo procedimento è basato sulla
Page 39 and 40: funzione di inaffidabilità U(t) (=
Page 41 and 42: (iii) Ad ogni pezzo possiamo cercar
Page 43 and 44: (i) Le monete numero 3 e numero 7 d
Page 45 and 46: OAO: la prima e la quinta moneta es
Page 47 and 48: Risoluzione. La probabilità richie
Page 49 and 50: — Esercizio 18. (a) Siano X, Y :

Note del corso di Analisi II (parte di calcolo delle probabilita' e ...

Create successful ePaper yourself

Delete template?

Save as template?