2. Rechenübung - Fachrichtung Mathematik - Technische ...
2. Rechenübung - Fachrichtung Mathematik - Technische ...
2. Rechenübung - Fachrichtung Mathematik - Technische ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Dr. Hans-Otfried Müller<br />
Institut für Mathematische Stochastik<br />
<strong>Fachrichtung</strong> <strong>Mathematik</strong><br />
<strong>Technische</strong> Universität Dresden<br />
http://www.math.tu-dresden.de/sto/mueller/<br />
Statistik I (Sozialwissenschaften)<br />
<strong>2.</strong> <strong>Rechenübung</strong>, WS 2012/2013, 26.11.–30.11.2012<br />
In dieser Übung werden zunächst vorhandene Überhänge aus der 1. <strong>Rechenübung</strong><br />
(z.B. Boxplots) besprochen.<br />
Bereiten Sie von diesen Zetteln die Aufgaben 12, 15 und 16 für die <strong>2.</strong> <strong>Rechenübung</strong><br />
vor.<br />
1<strong>2.</strong> Bei 150 Akten zu Steuerhinterziehungen fand man die folgende gemeinsame Häufigkeitsverteilung<br />
der Variablen X (Schulabschluss) und Y (Entdeckungszeitraum).<br />
X (Schulabschluss)<br />
1 (Volksschule)<br />
2 (höhere<br />
Schule)<br />
∑<br />
Y(Entdeckungszeitraum)<br />
∑<br />
1 (bereits 2 (innerhalb 3 (nach<br />
bei Versuch eines Jahres einem Jahr<br />
entdeckt) entdeckt) entdeckt)<br />
36 30 120<br />
40 150<br />
16<br />
(a) Vervollständigen Sie die Tabelle.<br />
(b) Ist der Anteil der erst nach einem Jahr entdeckten Steuerhinterziehungen bei den<br />
Tätern mit höherem Schulabschluss größer als bei den Volksschülern?<br />
(c) Wie groß ist der Anteil der spätestens bis Ende eines Jahres ertappten Steuersünder?<br />
(d) Haben die Volksschüler unter denen, die bereits beim Versuch ertappt wurden,<br />
einen größeren Anteil als unter allen Steuersündern?<br />
(e) Berechnen Sie Prozentsätze in den Zeilen, d.h. die bedingten Verteilungen von Y<br />
unter den verschiedenen Ausprägungen von X sowie die (relative) Randverteilung<br />
von Y, und stellen Sie diese in Form gestapelter Balkendiagramme für die Kategorien<br />
von X dar. Kann man aus dieser Darstellung auf eine Abhängigkeit des<br />
Entdeckungszeitraumes vom Schulabschluss schließen?<br />
(f) Berechnen Sie ausgehend von den Randverteilungen die Anzahl in den einzelnen<br />
Zellen, die sich im Falle der empirischen Unabhängigkeit ergeben würde (Indifferenztabelle,<br />
erwartete Häufigkeiten).<br />
(g) Berechnen Sie den Wert χ 2 = ∑ (h ij − ˜h ij ) 2<br />
als Maß für die Abweichung der<br />
˜h<br />
i,j ij<br />
beobachteten Tabelle von der bei Unabhängigkeit zu erwartenden Tabelle.<br />
15
13. Während der ALLBUS–Umfrage 1988 wurden Kirchenmitglieder zur Häufigkeit ihres<br />
Kirchganges befragt. Für die beiden in Deutschland bedeutendsten Kirchen sind in der<br />
folgenden Tabelle diese Häufigkeiten dargestellt:<br />
Evang.<br />
Kirche<br />
Röm.–<br />
kath.<br />
Kirche<br />
mind. 1mal 1–3mal mehr- seltener nie Gesamt<br />
2mal pro pro im mals<br />
Woche Woche Monat im Jahr<br />
5 55 110 308 560 234 1272<br />
56 289 215 328 345 156 1389<br />
Gesamt 61 344 325 636 905 390 2661<br />
(a) Gibt es bezüglich der Anteile derjenigen Kirchenmitglieder, die die Kirche nie<br />
besuchen, Unterschiede zwischen der evangelischen und der römisch–katholischen<br />
Kirche?<br />
(b) Wie groß ist der Anteil der Kirchgänger insgesamt, die wöchentlich oder häufiger<br />
die Kirche besuchen?<br />
(c) Bestimmen Sie die erwarteten Häufigkeiten für die Kategorien seltener“ und<br />
”<br />
nie“. Beurteilen Sie anhand der erhaltenen Resultate, ob empirische Unabhängigkeit<br />
zwischen Konfession und Häufigkeit des Kirchganges<br />
”<br />
vorliegt.<br />
14. Gegeben sind die folgenden Messwertpaare:<br />
X1 Y1 X2 Y2<br />
2,33 2,08 3,40 -7,48<br />
4,96 1,72 2,01 -3,43<br />
2,80 0,71 2,66 -5,93<br />
3,59 1,65 4,33 -9,20<br />
3,45 2,56 4,25 -12,01<br />
3,64 3,27 2,81 -4,91<br />
3,04 1,21 4,70 -11,59<br />
3,00 1,58 2,83 -5,68<br />
3,41 2,13 4,93 -13,39<br />
2,03 2,92 2,63 -3,87<br />
(a) Skizzieren Sie die zugehörigen Scatterplots.<br />
(b) Berechnen Sie getrennt für beide Stichproben arithmetische Mittelwerte, Standardabweichungen,<br />
Varianzen, Pearsonsche Korrelationskoeffizienten.<br />
(c) Berechnen Sie außerdem die Rangkorrelationskoeffizienten.<br />
(d) Interpretieren Sie die Ergebnisse.<br />
16
15. Die folgende Tabelle enthält die Klausurergebnisse einer Gruppe von Studenten in<br />
einer <strong>Mathematik</strong>- und einer Statistikklausur.<br />
Student Punkte Punkte<br />
<strong>Mathematik</strong><br />
Statistik<br />
1 38 39<br />
2 47 34<br />
3 44 31<br />
4 51 48<br />
5 35 46<br />
6 29 23<br />
7 22 17<br />
8 14 12<br />
9 12 16<br />
10 19 28<br />
11 9 10<br />
(a) Welches Skaleniveau weisen die Variablen Punkte <strong>Mathematik</strong> und Punkte<br />
Statistik auf?<br />
(b) Berechnen Sie für die Variable Punkte <strong>Mathematik</strong> folgende beschreibende<br />
Statistiken: arithmetisches Mittel, Median, unteres Quartil, oberes Quartil, Standardabweichung,<br />
Quartilsabstand, und zeichnen Sie den Boxplot.<br />
(c) Wieviel Prozent der Werte einer beliebigen Datenreihe liegen (näherungsweise)<br />
zwischen dem oberen und dem unteren Quartil?<br />
16. (a) Stellen Sie den in Aufgabe 15 angegebenen Datensatz mit Hilfe eines Scatterplots<br />
grafisch dar. Verwenden Sie dazu das vorbereitete Koordinatensystem:<br />
Scatterplot<br />
56 ✻<br />
52<br />
P unkte 48<br />
44<br />
40<br />
36<br />
S 32<br />
tatistik<br />
28<br />
24<br />
20<br />
16<br />
12<br />
8<br />
4<br />
0<br />
✲<br />
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56<br />
Punkte <strong>Mathematik</strong><br />
(b) Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten für die Variablen<br />
Punkte <strong>Mathematik</strong> und Punkte Statistik.<br />
(c) Wie ist die Abhängigkeit zwischen den beiden Datenreihen einzuschätzen (stark,<br />
mittel, schwach, nicht vorhanden)?<br />
(d) Berechnen Sie den Pearsonschen Korrelationskoeffizienten.<br />
(e) Wie ist das Vorzeichen des Pearsonschen Korrelationskoeffizienten zu interpretieren?<br />
17
17. Im Rahmen einer Studie wurde bei 10 Personengruppen einerseits der Schulbildungsstatus<br />
und andererseits der Berufsstatus jeweils in Form eines Gruppendurchschnittswertes<br />
erfasst. Die Ergebnisse zeigt die folgende Tabelle:<br />
Gruppe Schulbildungsstatus Berufsstatus<br />
1 13,0 50,4<br />
2 13,8 58,0<br />
3 11,4 46,5<br />
4 13,7 59,2<br />
5 12,2 49,9<br />
6 10,2 36,0<br />
7 9,5 32,0<br />
8 12,0 44,1<br />
9 11,2 43,3<br />
10 12,7 51,1<br />
(a) Zeichnen Sie den zugehörigen Scatterplot:<br />
62 ✻<br />
60<br />
58<br />
56<br />
Scatterplot<br />
B 54<br />
erufsstatus 52<br />
50<br />
48<br />
46<br />
44<br />
42<br />
40<br />
38<br />
36<br />
34<br />
32<br />
30<br />
✲<br />
9.0 9.5 10.0 10.5 11.0 11.5 1<strong>2.</strong>0 1<strong>2.</strong>5 13.0 13.5 14.0 14.5 15.0<br />
Schulbildungsstatus<br />
(b) Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten zwischen den<br />
Variablen Schulbildungsstatus und Berufsstatus.<br />
(c) Wie ist die statistische Abhängigkeit der erhobenen Merkmale einzuschätzen<br />
(stark, mittel, schwach, nicht vorhanden)?<br />
18. Man lässt 5 Personen, die sich für eine ausgeschriebene Stelle beworben haben, jeweils<br />
die beiden Intelligenztests I und II durchlaufen und erhält folgende Punktzahlen:<br />
Person Nr. i Punktzahl der Person i Punktzahl der Person i<br />
bei Test I<br />
bei Test II<br />
1 95 109<br />
2 110 126<br />
3 121 117<br />
4 87 89<br />
5 105 81<br />
18
(a) Zeichnen Sie den zugehörigen Scatterplot:<br />
Y<br />
Scatterplot<br />
✻<br />
135<br />
125<br />
115<br />
105<br />
95<br />
85<br />
75<br />
✲<br />
80 85 90 95 100 105 110 115 120 125 X<br />
(b) Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten.<br />
19. Bei einem Gebrauchtwagenhändler wurde für 7 Wagen desselben Typs der Preis und<br />
das Alter festgestellt:<br />
Alter in Jahren 1.5 4 7 1.3 2 1 6<br />
Preis in 1000 EURO 6 3 2 7.5 4 9.5 1.5<br />
Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten und den Korrelationskoeffizienten<br />
nach Pearson. Wie ist das negative Vorzeichen zu erklären?<br />
20. (a) Ein Landwirt möchte feststellen, ob ein Zusammenhang zwischen Blütebeginn<br />
und Erntebeginn bei Süßkirschen besteht. In einem Jahr machte er an 5 Bäumen<br />
folgende Beobachtungen:<br />
Baum: 1 2 3 4 5<br />
Blütebeginn: 28.04.2001 29.04.2001 01.05.2001 0<strong>2.</strong>05.2001 03.05.2001<br />
Erntebeginn: 0<strong>2.</strong>07.2001 25.06.2001 27.06.2001 03.07.2001 26.06.2001<br />
Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten für die beiden<br />
Datenreihen.<br />
(b) Die Leistungen von 6 Studenten der Soziologie wurden von Prüfer M. wie folgt<br />
geordnet:<br />
Student: A B C D E F<br />
Rang Prüfer M.: 4 2 1 3 5 6<br />
Rang Prüfer H.:<br />
Prüfer H. hatte die Leistungen ebenfalls geordnet und es ergab sich ein Rangkorrelationskoeffizient<br />
(nach Spearman) von r s = −1 zwischen den Rangreihen von<br />
M. und H. Wie lautet die Rangfolge der Leistungsbewertung von H.?<br />
19
21. Ein Consultingunternehmen testet die analytischen Fähigkeiten von Bewerbern. Von<br />
2000 Bewerbern erzielten 600 ein gutes, 900 ein mittelmäßiges und 500 ein schlechtes<br />
Testergebnis. Routinemäßig wurde auch die Haarfarbe der Bewerber erfasst: 1000 hatten<br />
braune Haare, 400 waren blond und 600 waren schwarz. Man darf erwarten, dass das<br />
Testergebnis weitgehend unabhängig von der Haarfarbe ist. Bei den 2000 Bewerbern<br />
lag sogar exakte empirische Unabhängigkeit vor.<br />
(a) Stellen Sie die zugehörige Kontingenztafel auf.<br />
(b) Geben Sie χ 2 und den Kontingenzkoeffizienten an.<br />
2<strong>2.</strong> Zwei Hochschullehrer A. und B. beurteilen die Leistungen ihrer Studenten durch Punkte.<br />
Die folgende Tabelle enthält die Bewertungen einer Teilgruppe von 8 Studenten.<br />
Berechnen Sie den Spearmanschen Rangkorrelationskoeffizienten für diese Daten.<br />
Student: 1 2 3 4 5 6 7 8<br />
Punkte A.: 25 33 46 17 11 50 28 44<br />
Punkte B.: 40 33 22 17 45 16 35 25<br />
Das studentische Evaluationsbüro errechnet aus den dort vorliegenden Daten für alle<br />
Studenten einen Spearmanschen Rangkorrelationskoeffizienten von −0.9. Welche der<br />
folgenden Aussagen sind richtig?<br />
(a) Einer der Hochschullehrer beurteilt die Studenten um 90% schlechter als der andere.<br />
(b) Die meisten Studenten, die bei dem einen Hochschullehrer eine hohe Punktzahl<br />
haben, haben bei dem anderen Hochschullehrer eine niedrige Punktbewertung.<br />
(c) Die beiden Hochschullehrer haben hinsichtlich der Leistungsreihenfolge in der<br />
Studentengruppe weitgehend entgegengesetzte Vorstellungen.<br />
(d) Der Spearmansche Rangkorrelationskoeffizient kann keine negativen Werte annehmen.<br />
20