Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II

vwi.tu.dresden.de
von vwi.tu.dresden.de Mehr von diesem Publisher
04.01.2015 Aufrufe

Technische Universität Dresden, Professur für Verkehrsökonometrie und -statistik Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Geburtstagsparadoxon Auf einer Party kommen n Leute zusammen. Wir stellen uns die Frage, wie hoch die Wahrscheinlichkeit dafür ist, dass mindestens 2 Leute am gleichen Tag Geburtstag haben. Gehen Sie vereinfachend davon aus, dass keiner am 29. Februar Geburtstag hat und alle Geburtstage gleichwahrscheinlich sind. (a) Zunächst ist die Party mit n = 6 Personen noch klein. Wie hoch ist die Wahrscheinlichkeit, dass mindestens 2 Leute am gleichen Tag Geburtstag haben Um wieviel ist diese Wahrscheinlichkeit höher als bei n = 2 Personen (b) Berechnen Sie die Wahrscheinlichkeit P n für beliebige n. Sie können für kleine x von der Näherung 1 − x ≈ e −x Gebrauch machen. Praktisch ist auch noch die Gauß’sche Summenformel 1 + 2 + 3 + · · · + (n − 1) = n(n − 1) . 2 (c) Ab wieviel Leuten ist P n ≥ 0.5, d.h. wann lohnt es sich zu wetten Lösung: Geburtstagsparadoxon Kurze Variante: Person A hat mit der Wahrscheinlichkeit 1/365 am 1. Januar Geburtstag. Dementsprechend ist die Wahrscheinlichkeit für nicht am 1. Januar Geburtstag 364/365. Dass Person B an einem anderen Tag als Person A Geburtstag hat, hat die Wahrscheinlichkeit 364/365. Die Wahrscheinlichkeit für Person C an einem anderen Tag als A oder B ist 363/365 etc. Mit dem Ereignis A = “n Leuten haben an verschiedenen Tagen Geburtstag” ergibt sich durch Multiplikation Bevor wir losrechnen, gibt es noch den P(A) = 365 365 · 364 365 · 363 365 − (n − 1) · . . . 365 365 (1) www.mtreiber.de/statistikTrainingsaufg Seite 1

Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />

<strong>Tra<strong>in</strong><strong>in</strong>gsaufgaben</strong> <strong>zur</strong> <strong>Klausurvorbereitung</strong><br />

<strong>in</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong><br />

Geburtstagsparadoxon<br />

Auf e<strong>in</strong>er Party kommen n Leute zusammen. Wir stellen uns die Frage, wie hoch die<br />

Wahrsche<strong>in</strong>lichkeit dafür ist, dass m<strong>in</strong>destens 2 Leute am gleichen Tag Geburtstag haben.<br />

Gehen Sie vere<strong>in</strong>fachend davon aus, dass ke<strong>in</strong>er am 29. Februar Geburtstag hat <strong>und</strong> alle<br />

Geburtstage gleichwahrsche<strong>in</strong>lich s<strong>in</strong>d.<br />

(a) Zunächst ist die Party mit n = 6 Personen noch kle<strong>in</strong>. Wie hoch ist die Wahrsche<strong>in</strong>lichkeit,<br />

dass m<strong>in</strong>destens 2 Leute am gleichen Tag Geburtstag haben Um wieviel<br />

ist diese Wahrsche<strong>in</strong>lichkeit höher als bei n = 2 Personen<br />

(b) Berechnen Sie die Wahrsche<strong>in</strong>lichkeit P n für beliebige n. Sie können für kle<strong>in</strong>e x von<br />

der Näherung<br />

1 − x ≈ e −x<br />

Gebrauch machen. Praktisch ist auch noch die Gauß’sche Summenformel<br />

1 + 2 + 3 + · · · + (n − 1) =<br />

n(n − 1)<br />

.<br />

2<br />

(c) Ab wieviel Leuten ist P n ≥ 0.5, d.h. wann lohnt es sich zu wetten<br />

Lösung: Geburtstagsparadoxon<br />

Kurze Variante:<br />

Person A hat mit der Wahrsche<strong>in</strong>lichkeit 1/365 am 1. Januar Geburtstag. Dementsprechend<br />

ist die Wahrsche<strong>in</strong>lichkeit für nicht am 1. Januar Geburtstag 364/365. Dass<br />

Person B an e<strong>in</strong>em anderen Tag als Person A Geburtstag hat, hat die Wahrsche<strong>in</strong>lichkeit<br />

364/365. Die Wahrsche<strong>in</strong>lichkeit für Person C an e<strong>in</strong>em anderen Tag als A oder<br />

B ist 363/365 etc. Mit dem Ereignis A = “n Leuten haben an verschiedenen Tagen<br />

Geburtstag” ergibt sich durch Multiplikation<br />

Bevor wir losrechnen, gibt es noch den<br />

P(A) = 365<br />

365 · 364<br />

365 · 363 365 − (n − 1)<br />

· . . .<br />

365 365<br />

(1)<br />

www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 1


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />

0.1 Ausführlichen, formalisierten Ansatz:<br />

Zunächst müssen wir versuchen, e<strong>in</strong> geeignetes Ereignis zu def<strong>in</strong>ieren. Die Aufgabe zielt<br />

darauf ab, die Wahrsche<strong>in</strong>lichkeit P zu messen von<br />

A(n) = “m<strong>in</strong>d. 2 von n Leuten haben am gleichen Tag Geburtstag”. (2)<br />

Wir betrachten das Komplement<br />

A(n) = “n Leute haben an verschiedenen Tagen Geburtstag”. (3)<br />

Das Ereignis A(n) kann man aufbröseln, <strong>in</strong>dem man es zerlegt <strong>in</strong> die Ereignisse mit<br />

durchnummerierten Personen<br />

(a) A 12 “Wahrsche<strong>in</strong>lichkeit, dass Person 1 <strong>und</strong> 2 an verschiedenen Tagen Geburtstag<br />

haben”,<br />

(b) A 123 “Wahrsche<strong>in</strong>lichkeit, dass Person 1,2 <strong>und</strong> 3 an verschiedenen Tagen Geburtstag<br />

haben”,<br />

(c) . . .,<br />

n. A 123...n “Wahrsche<strong>in</strong>lichkeit, dass Person 1, 2, 3 . . .n an verschiedenen Tagen Geburtstag<br />

haben”.<br />

Dafür lassen sich <strong>in</strong>tuitiv bed<strong>in</strong>gte Wahrsche<strong>in</strong>lichkeiten angeben (die Bed<strong>in</strong>gungen stellen<br />

sicher, dass wirklich alle Personen an verschiedenen Tagen Geburtstag haben):<br />

P(A 12 |A 1 ) = 364<br />

365<br />

P(A 123 |A 1 ∩ A 12 ) = 363<br />

365<br />

365 − (n − 1)<br />

P(A 12...n |A 1 ∩ A 12 ∩ · · · ∩ A 12...n ) =<br />

365<br />

Jetzt kann man die formale Rechnung beg<strong>in</strong>nen, wobei wir die Verallgeme<strong>in</strong>erung des<br />

Multiplikationstheorems verwenden 1<br />

P(A(n)) = P(A 1 ∩ A 12 ∩ A 123 ∩ . . .A 123...n )<br />

= P(A 1 ) · P(A 12 |A 1 ) · · · · · P(A 12...n |A 1 ∩ A 12 . . .A 12...(n−1) ).<br />

Die Wahrsche<strong>in</strong>lichkeiten P(A 12 |A 1 ) etc. haben wir uns schon überlegt. Bleibt noch<br />

P(A 1 ). Dazu stellen wir uns den Fall mit n = 1 vor. Welchen Wert würde man P(A(1))<br />

1 Es gilt<br />

P(A 1 ∩A 2 ∩A 3 ∩. . . A n) = P(A 1) ·P(A 2|A 1) ·P(A 3|A 1 ∩A 2) · · · P(A n|A 1 ∩A 2 ∩. . . A 12...(n−1) ), (4)<br />

was man durch Ausschreiben der bed<strong>in</strong>gten Wahrsche<strong>in</strong>lichkeiten der rechten Seite <strong>und</strong> anschliessendes<br />

Kürzen leicht sieht.<br />

www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 2


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />

s<strong>in</strong>nvollerweise zuordnen Damit die Aufgabe nicht trivial wird (man selbst hat immer<br />

am gleichen Tag wie man selbst Geburtstag), def<strong>in</strong>ieren wir P(A(1)) ≡ P(A 1 ) = 0 <strong>und</strong><br />

entsprechend P(A 1 ) = 1 − P(A 1 ) = 1. Man erhält also das Produkt<br />

P ( A (n) ) = 1 · 364<br />

365 · 363 365 − (n − 1)<br />

· . . .<br />

(<br />

365 365<br />

= 1 · 1 − 1 ) (<br />

· 1 − 2 ) (<br />

· · · · · 1 − n − 1 )<br />

365 365 365<br />

Unf jetzt die Näherung:<br />

Für größere n oder den Aufgabenteil 3 ist dieser Ausdruck zu umständlich. Wir wollen<br />

durch e<strong>in</strong>e Näherung das Produkt vere<strong>in</strong>fachen, <strong>in</strong>dem wir ausnutzten, dass man für<br />

kle<strong>in</strong>e x auch schreiben kann<br />

1 − x ≈ e −x . (5)<br />

Damit lautet der Ausdruck<br />

P(A(n)) ≈<br />

1 · e −1/365 · e −2/365 · . . .e −(n−1)/365<br />

= e − 1<br />

365 (1+2+3+...+(n−1))<br />

= e − 1<br />

365 · n(n−1)<br />

2 ,<br />

wobei wir im letzten Schritt die Gauss’sche Summenformel<br />

1 + 2 + 3 + . . . + (n − 1) =<br />

n(n − 1)<br />

2<br />

verwendet haben. Damit erhält man also die Näherungsformel<br />

(6)<br />

P(A(n)) = 1 − P(A(n))<br />

≈ 1 − e − 1 n(n−1)<br />

365 2 .<br />

Party mit 6 Leuten<br />

Berechnen wir erstmal mit der eben gewonnenen Formel die Wahrsche<strong>in</strong>lichkeiten für<br />

n = 6 <strong>und</strong> n = 2 aus:<br />

P(A(6)) = 1 − e − 6·5<br />

730 ≈ 0.04026<br />

P(A(2)) = 1 − e − 2·1<br />

730 ≈ 0.002735<br />

Aus dem Verhältnis der Zahlen ergibt sich, dass die Wahrsche<strong>in</strong>lichkeit um ca. den<br />

Faktor 15 erhöht ist. Auf den ersten Blick paradox, oder 2 Wir könnten uns auch die<br />

Mühe machen <strong>und</strong> die Ergebnisse exakt, d.h. ohne Näherung berechnen:<br />

P (A (2)) = 1 − 1 · 364<br />

365<br />

≈ 0.002740.<br />

2 Dieses Problem wird gerne als Paradoxie bezeichnet, aber es ist eher gegen die Intuition als wirklich<br />

paradox.<br />

www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 3


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />

P (A (6)) = 1 − 1 · 364<br />

365 · 363<br />

365 · 362<br />

365 · 361<br />

365 · 360<br />

365<br />

≈ 0.04046<br />

Der Fehler durch die Näherung ist also (zum<strong>in</strong>dest für n ≤ 6) kle<strong>in</strong>.<br />

Wann ist P(A(n)) ≥ 0.5 <br />

Wir können die Bestimmungsgleichung für n h<strong>in</strong>schreiben:<br />

1 − e − 1 n(n−1)<br />

365 2 ≥ 1 2 . (7)<br />

Logarithmieren der Gleichung <strong>und</strong> ln1/2 = − ln2 führen auf<br />

− ln2 ≥ −<br />

n(n − 1)<br />

. (8)<br />

730<br />

Multiplizieren mit −1 dreht das Ungleichheitszeichen um <strong>und</strong> es ergibt sich die quadratische<br />

Gleichung<br />

0 ≤ n 2 − n − 730 ln2. (9)<br />

Lösung mit der “pq”-Formel 3 (wobei nur die positive Lösung s<strong>in</strong>nvoll ist):<br />

n = 1 2 + √730 ln2 + 1 4<br />

≈ 22.98. (11)<br />

Also ist für e<strong>in</strong>e Gruppe mit n ≥ 23 die Wahrsche<strong>in</strong>lichkeit größer als 50%, dass zwei<br />

Leute am gleichen Tag Geburtstag haben. Man kann noch das Ergebnis der Näherung<br />

mit der “richtigen Lösung” ohne Näherung vergleichen, <strong>in</strong>dem man e<strong>in</strong>en Computer<br />

befragt:<br />

P(A(23)) exakt ≈ 0.507<br />

P(A(23)) genaehrt ≈ 0.500<br />

Die Näherung führt also – wenn auch knapp – zum gleichen n.<br />

3 Eher für mich als für den Rest der Welt: x 2 + px + q = 0 wird gelöst durch<br />

x 1/2 = − p r<br />

p<br />

2 ± 2<br />

− q. (10)<br />

4<br />

www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 4


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<br />

1<br />

0.8<br />

P(Doppelgeburtstag)<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

n<br />

pDoppel(n)<br />

n<br />

pDoppelNaeh(n)<br />

5 10 15 20 25 30 35 40 45 50<br />

Groesse n der Gruppe<br />

www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Seite 5

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!