Slides: Sandsynligheder (Ny: 2006)
Slides: Sandsynligheder (Ny: 2006)
Slides: Sandsynligheder (Ny: 2006)
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Statistik og Databehandling N:<br />
sandsynligheder<br />
Kursushjemmeside:<br />
http://www.imf.au.dk/kurser/<br />
statdatabehandling/F06/<br />
Jens Ledet Jensen<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 1/20
Praktiske bemærkninger<br />
Bog: Købes i Stakbogladen<br />
Ugesedler og noter: downloades fra hjemmesiden<br />
Tavle: Udenfor Aud E.<br />
Bokse til aflevering:<br />
Informationskontoret under instruktornavn<br />
Opgavesæt: nye opgaver samt små omformuleringer af<br />
opgaver fra bog. Kig altid her før I kigger i bogen.<br />
Fordelinger<br />
Estimation og test: katalog<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 2/20
Eksempel:<br />
Hvad skal vi med statistik?<br />
Aar 2003 2004 2005<br />
♯ grov vold 200 215 230<br />
<strong>Ny</strong>hed i TV: kraftig stigning i grov vold. Er dette rigtigt?<br />
Kan tallene forklares ved tilfældige udsving?<br />
• population • sandsynligheder<br />
Har måden at opgøre tallene på ændret sig?<br />
Eksempel: Solsvingninger/jordtemperatur<br />
Svært: usikkerhed i tallene - hvad betyder en tilfældig<br />
sammenhæng<br />
Finde fysisk forklaring på sammenhæng<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 3/20
Kosmisk stråling<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 4/20
Søndagsavisen<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 5/20
Sessionstal<br />
total BMI>30 procent<br />
F03 11527 796 6.9<br />
E03 12259 825 6.7<br />
http://forsvaret.dk/FVR/V%C3%A6rnepligt/Statistiske+oplysninger/BMI/<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 6/20
Statistik<br />
Al statistisk argumentering er baseret på sandsynligheder<br />
Typisk / Ikke-typisk<br />
Timerne i dag: <strong>Sandsynligheder</strong><br />
Oversigt over kurset?<br />
Følger bogen<br />
Undtagelse: kapitel 8 overspringes, kapitel 12 hvis tid<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 7/20
<strong>Sandsynligheder</strong><br />
Hvad er en sandsynlighed? ss<br />
(a) ss for plat eller krone i møntkast: 1 2<br />
(b) ss for en 6-er i terningekast: 1 6<br />
(c) ss for 2 6-er i kast med to terninger: 1<br />
36 = 1 6 · 1 6<br />
(d) ss for 4 esser i 13 ud af 52 kort: 13<br />
52<br />
(Placere es 1, dernæst es 2 osv)<br />
· 12<br />
51<br />
· 11<br />
50<br />
(e) ss for en ulykke under flystart: ?<br />
(f) ss for et biluheld på Grenåvej i myldretid: ?<br />
(g) ss for solskinsvejr i morgen: ?<br />
· 10<br />
49<br />
= 0.0026<br />
(h) ss for at vinde landskampen mod Sverige i 2005: ?<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 8/20
SS: fysisk definition<br />
Definition ("fysisk"): ss for en hændelse er den frekvens<br />
hvormed hændelsen optræder i uafhængige gentagelser<br />
(a)-(d): passer fint<br />
(e): antal ulykker / antal starter<br />
(g): finde dage med vejr der ligner i dag, tælle op hvor<br />
mange der havde sol dagen efter<br />
(h): duer ikke: hver ny kamp er en ny situation<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 9/20
SS: fysisk definition<br />
0 ≤ ss ≤ 1 optræder altid: ss=1 optræder aldrig: ss=0<br />
A: en hændelse (Ex: få en 6-er i terningekast)<br />
<br />
1 hvis A optræder i j’te gentagelse<br />
Ij(A) =<br />
0 hvis A ikke optræder<br />
Så er frekvensen i n gentagelser<br />
n<br />
j=1 Ij(A)<br />
ss = grænseværdien når n → ∞<br />
= P(A)<br />
FIGUR<br />
n<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 10/20
SS: P(A ∪ B)<br />
A og B er disjunkte hændelser:<br />
hvis A optræder så er B udelukket, og omvendt<br />
Ex: A: få en 6-er i terningekast; B: få en 5-er<br />
A ∪ B: A optræder eller B optræder<br />
Ij(A ∪ B) = Ij(A) + Ij(B) når de er disjunkte<br />
n<br />
j=1 Ij(A ∪ B)<br />
n<br />
Derfor må der gælde<br />
=<br />
n<br />
j=1 Ij(A)<br />
n<br />
+<br />
n<br />
j=1 Ij(B)<br />
n<br />
P(A ∪ B) = P(A) + P(B), A og B er disjunkte<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 11/20
Sandsynlighedsmodel<br />
Definition ("matematisk"):<br />
1) Udfaldsrum (ofte betegnet med Ω):<br />
indeholder alle mulige resultater af et eksperiment<br />
Ex1: Kaste en mønt Ω = {pl,kr}<br />
Ex2: Kaste en terning Ω = {1, 2, 3, 4, 5, 6}<br />
Ex3: Kaste en mønt to gange<br />
Ω = {(pl,pl), (pl,kr), (kr,pl), (kr,kr)}<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 12/20
SS-model: hændelser<br />
2) En samling af hændelser (hændelsesalgebra A = "de<br />
spørgsmål vi kan stille"<br />
hændelse: delmængde af udfaldsrum<br />
Ex1: Ω = {pl,kr}, hændelsen krone {kr}<br />
Ex2: Ω = {1, 2, 3, 4, 5, 6}, hændelsen et lige antal øjne<br />
{2, 4, 6}<br />
Ex3: Ω = {(pl,pl), (pl,kr), (kr,pl), (kr,kr)},<br />
hændelsen mindst een krone {(pl,kr), (kr,pl), (kr,kr)}<br />
Krav til A:<br />
Hvis A ∈ A og B ∈ A så er A ∪ B ∈ A og A ∩ B ∈ A<br />
A ∪ B: enten A eller B (eller dem begge)<br />
A ∩ B: både A og B<br />
Ω ∈ A (den sikre hændelse)<br />
∅ ∈ A (∅ = den tomme mængde)<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 13/20
SS-model: hændelser<br />
Ex4: Kaste en terning to gange<br />
Ω = {(1, 1), (1, 2),... , (1, 6), (2, 1),... , (2, 6),...,(6, 6)}<br />
(36 elementer)<br />
A = 6-er i kast 1 A = {(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}<br />
B = 6-er i kast 2 B = {(1, 6), (2, 6), (3, 6), (4, 6), (5, 6), (6, 6)}<br />
A ∩ B = 6-er i begge kast A ∩ B = {(6, 6)}<br />
A ∪ B = mindst een 6-er A ∪ B har 11 elementer<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 14/20
SS-model: ss-mål<br />
3) Et sandsynlighedsmål P<br />
For enhver hændelse A ∈ A angiver P(A) ss:<br />
0 ≤ P(A) ≤ 1 P(Ω) = 1 P(∅) = 0<br />
P(A ∪ B) = P(A) + P(B), hvis A og B er disjunkte<br />
(husk den "fysiske" ss)<br />
Ex1: P({kr}) = 1 2<br />
Ex2:<br />
P(lige antal øjne) = P({2})+P({4})+P({6}) = 1 6 + 1 6 + 1 6 = 1 2<br />
Ex3: P(mindst een krone) =<br />
P({(pl,kr)}) + P({(kr,pl)}) + P({(kr,kr)}) = 1 4 + 1 4 + 1 4 = 3 4<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 15/20
Additionssætningen<br />
A og B er to mængder, ikke nødvendigvis disjunkte<br />
C = A ∩ B A0 = A \ C B0 = B \ C<br />
Så er A ∪ B = A0 ∪ B0 ∪ C A0,B0,C er disjunkte<br />
Dermed<br />
P(A ∪ B) = P(A0 ∪ B0 ∪ C) = P((A0 ∪ B0) ∪ C)<br />
= P(A0 ∪ B0) + P(C) = P(A0) + P(B0) + P(C)<br />
= P(A0) + P(C) + P(B0) + P(C) − P(C)<br />
= P(A) + P(B) − P(C)<br />
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)<br />
Ex4: P(mindst een 6-er i to kast) = 1<br />
6<br />
+ 1<br />
6<br />
− 1<br />
36<br />
= 11<br />
36<br />
P(6-er i første) + P(6-er i anden) − P(6-er i begge)<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 16/20
Population<br />
Situation: Indsamling af data fra en population<br />
Ω = populationen<br />
P svarer til at et individ vælges tilfældigt<br />
Ex1: Møntkast. Population: pl og kr<br />
Ex2: Population = danske mænd over 20 år - ønsker at<br />
undersøge deres højde<br />
Ω = {ω1,ω2,...,ωk}, population har k individer<br />
P({ωi}) = 1 k tilfældig udvælgelse: alle individer er lige<br />
sandsynlige<br />
P(tilfældig udvalgt person hedder Jensen)?<br />
Hvis A er en delmængde af Ω får vi P(A) = |A|<br />
k hvor |A| er<br />
antallet af individer i A. P(A) = andelsfunktionen.<br />
Hvis vi tilfældigt udvælger m individer fra en population<br />
kaldes dette en stikprøve<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 17/20
Ex: Radioaktivt henfald<br />
Experiment: registrerer antal klik i geigertæller i et givet<br />
tidsrum stammende fra et radioaktivt materiale<br />
Ω = {0, 1, 2,...} alle ikke-negative heltal<br />
P(i) ? Der er ikke et symmetri eller "lige store ss"<br />
argument<br />
Grænseargument: meget stort antal atomer, kun få af disse<br />
henfalder i et givet tidsrum →<br />
P(i) = poissonsandsynlighed<br />
At argumentet er korrekt eftervises ved mange gentagelser<br />
af forsøget, jvf "fysiske" definition af ss<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 18/20
Ingen statistik uden data<br />
Pige- og drengehøjder blandt deltagere i kurset<br />
Plot<br />
Er der forskel på højden af piger og drenge?<br />
Hvad mener vi med dette spørgsmål?<br />
Bagvedliggende population?<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 19/20
Opsummering<br />
Udfaldsrum Ω:<br />
alle muligheder for resultat af experiment<br />
Sandsynlighedsmål P :<br />
frekvens i uafhængige gentagelser<br />
Statistik og Databehandling N: sandsynlighederKursushjemmeside:http://www.imf.au.dk/kurser/statdatabehandling/F06/ – p. 20/20