11. Parametrische Signifikanztests
11. Parametrische Signifikanztests
11. Parametrische Signifikanztests
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>11.</strong> <strong>Parametrische</strong> <strong>Signifikanztests</strong><br />
In den vorangegangenen Sitzungen wurde davon ausgegangen, dass einzelne empirische<br />
Verteilungen durch entsprechende theoretische Verteilungen wiedergegeben<br />
werden können. Auf dieser Grundlage wurden Wahrscheinlichkeiten berechnet. Die<br />
Frage ob die empirischen Verteilungen tatsächlich den theoretischen entsprechen<br />
oder die aus der Stichprobe berechneten Parameter die der Grundgesamtheit wiedergeben,<br />
blieb dabei unbeantwortet.<br />
Zur Klärung dieser Frage stellt die schließende Statistik die <strong>Signifikanztests</strong> zur Verfügung<br />
mit denen geprüft werden kann ob:<br />
• Der Mittelwert oder die Varianz einer Stichprobe gleich, ungleich, größer oder<br />
kleiner dem Mittelwert oder der Varianz der Grundgesamtheit ist (Parametertests)<br />
• Die empirische Verteilung durch eine theoretische Verteilung erklärt werden<br />
kann (Anpassungstests)<br />
Zur Beantwortung entsprechender Fragestellungen werden in der Statistik <strong>Signifikanztests</strong><br />
durchgeführt die nach folgendem Schema aufgebaut sind:<br />
1. Spezifikation einer Null- und einer Alternativhypothese<br />
2. Festlegung eines Signifikanzniveaus<br />
3. Auswahl einer Testfunktion<br />
4. Berechnung des Testwertes und Entscheidung<br />
Für jeden dieser vier Schritte existieren klare Vorgaben, die von der Fragestellung,<br />
die jeweils untersucht wird, abhängen. Unterschieden werden:<br />
• <strong>Parametrische</strong> Tests – die sich mit der Untersuchung von einzelnen<br />
Parametern (µ,σ,σ² ...) befassen, und<br />
• Nichtparametrische Tests – die sich mit Aussagen über die Verteilung<br />
(z.B. Normalverteilung) befassen<br />
Beispiel für einen parametrischen Test:<br />
Von der Abfüllanlage einer Brauerei werden Flaschen gefüllt, wobei die Füllmenge X<br />
pro Flasche gewissen Schwankungen unterliegt. In den Herstellerangaben der Abfüllanlage<br />
wurde angegeben, dass die durchschnittliche Füllmenge µ0 = 500 cm³, mit<br />
einer Standardabweichung von σ = 1.5, betrage. Anhand einer Stichprobe vom Umfang<br />
n = 25 wurde die durchschnittliche Füllmenge von 499.28 cm³ (= µ1) empirisch<br />
ermittelt. Anhand dieser beiden Werte können nun unterschiedliche Fragestellungen<br />
untersucht werden, abhängig von der Interessenlage der Personen, die die Untersuchung<br />
durchführen.<br />
a) eine Eichkommission ist an der generellen Abweichung vom Sollwert interessiert.<br />
b) ein Verbraucherschutzverband ist daran interessiert ob der Istwert deutlich<br />
kleiner als der Sollwert ist.<br />
c) der Brauereibesitzer ist daran interessiert ob im Mittel zuviel abgefüllt wird<br />
11-1
<strong>11.</strong>1. Formulierung der Hypothesen<br />
Beim Aufbau eines <strong>Signifikanztests</strong> werden immer zwei Hypothesen formuliert:<br />
Die Nullhypothese die mit H0 bezeichnet wird und immer die Fragestellung beschreibt,<br />
die untersucht werden soll. Im allgemeinen Formuliert die Nullhypothese die<br />
Gleichheit. Für das Beispiel wäre H0:<br />
„Ist der Mittelwert der Stichprobe gleich dem Mittelwert, den der Hersteller angegeben<br />
hat?“ Also:<br />
H0: µ0 = µ1<br />
Eine Alternativhypothese, die mit HA oder H1 bezeichnet wird und sich als Gegenhypothese<br />
aus der Fragestellung und H0 ergibt. Für das Beispiel können folgende<br />
HA formuliert werden:<br />
a) HA: µ 0 ≠µ 1<br />
b) HA: µ 1 < µ 0<br />
c) HA: µ 1 > µ 0<br />
Bei der Bestimmung des Mittelwertes µ 1 aus einer Stichprobe ist zu erwarten, dass<br />
nicht genau der tatsächliche Wert der Grundgesamtheit getroffen wird. Ist die Stichprobe<br />
repräsentativ kann aber davon ausgegangen werden das µ 1 nicht allzusehr<br />
vom tatsächlichen Wert µ 0 abweicht. Für die formulierten Hypothesen bedeutet dies:<br />
H0 (µ 1 = µ 0 ) wird abgelehnt und damit die Alternativhypothese angenommen, wenn je<br />
nach Fragestellung gilt:<br />
a) HA: µ 0 ≠µ 1 , wenn |µ 1 - µ 0 | sehr groß ist<br />
b) HA: µ 1 < µ 0 , wenn µ 1 sehr viel kleiner als µ 0 ist<br />
c) HA: µ 1 > µ 0 , wenn µ 1 sehr viel größer als µ 0 ist.<br />
Zur Präzisierung der Entscheidungen ob die Abweichungen „sehr groß“ oder „sehr<br />
viel größer bzw. kleiner“ sind, wird das Signifikanzniveau festgelegt.<br />
<strong>11.</strong>2. Signifikanzniveau<br />
Das Signifikanzniveau bezeichnet die akzeptierte Irrtumswahrscheinlichkeit mit der<br />
die Nullhypothese abgelehnt wird obwohl sie richtig ist. Oder anders ausgedrückt<br />
bezeichnet das Signifikanzniveau die Güte des Tests. Die Festlegung eines geeigneten<br />
Signifikanzniveaus ist problemorientiert, entsprechend der Fragestellung vorzunehmen.<br />
Alternativ kann das Signifikanzniveau auch als Risiko betrachtet werden, wenn es<br />
beispielsweise darum geht die Wahrscheinlichkeit für Schäden zu beziffern.<br />
In der Wasserwirtschaft werden Deiche oft so konstruiert, dass das Risiko eines Ü-<br />
berflutens zu 95% ausgeschlossen ist. Für die Sicherheit von Kernkraftwerken ist ein<br />
niedrigeres Risiko wünschenswert, so dass Unfälle mit nahezu 100%iger Sicherheit<br />
ausgeschlossen werden können.<br />
Für das Beispiel sei ein Signifikanzniveau α = 0.01 vorgegeben.<br />
11-2
Das bedeutet, dass die Wahrscheinlichkeit für die Entscheidung die Nullhypothese<br />
abzulehnen obwohl sie richtig ist bei 1% liegt. Anders ausgedrückt bedeutet dies: Die<br />
Wahrscheinlichkeit für eine richtige Entscheidung liegt bei 99%.<br />
Sehr oft muss α nicht frei bestimmt werden sondern ist durch die Vorgaben der Interessensgruppe<br />
oder durch die Aufgabenstellung a priori festgelegt.<br />
Denkbar wäre beispielsweise, dass die Eichkommission höhere Anforderungen an<br />
die Güte des Testes stellt als die Verbraucherschutzorganisationen.<br />
<strong>11.</strong>3. Auswahl der Testfunktion<br />
Die Auswahl einer geeigneten Testfunktion ist von verschiedenen Kriterien abhängig:<br />
a) Von der Art des Tests: parametrisch oder nichtparametrisch<br />
b) Vom Parameter, der durch die Nullhypothese untersucht werden soll; µ, σ, σ²<br />
c) Von der Verteilung der Grundgesamtheit aus der die Stichprobe ermittelt wurde.<br />
Die Testfunktion beschreibt nicht mehr die Verteilung der Grundgesamtheit sondern<br />
die Verteilung der Testgröße (im Falle des Beispieles die Verteilung des Mittelwerts).<br />
<strong>11.</strong>3.1. Gaußtest<br />
Beim Beispiel handelte es sich um:<br />
a) Einen parametrischen Test (Mittelwert wird untersucht)<br />
b) Untersucht wird H 0 : µ 1 = µ 0<br />
c) Die Grundgesamtheit war normalverteilt mit µ = 500 und σ = 1.5<br />
Aus diesen Kriterien folgt, dass die Testgröße N(0,1) also standardnormalverteilt ist.<br />
D.h. würden sehr viele Stichproben aus der Grundgesamtheit gezogen und die Verteilung<br />
der Mittelwerte betrachtet, wäre diese auch normalverteilt.<br />
0,45<br />
0,40<br />
0,35<br />
0,30<br />
0,25<br />
0,20<br />
0,15<br />
0,10<br />
0,05<br />
0,00<br />
-5 -4 -3 -2 -1 0 1 2 3 4 5<br />
11-3
Berechnung des Testwertes<br />
Die Testgröße v berechnet sich im Falle der Normalverteilung nach:<br />
v<br />
=<br />
X<br />
− µ 0<br />
σ<br />
Die Testgröße wird nun gegen die Werte der Standardnormalverteilung an den Signifikanzstellen<br />
verglichen um zu einer Entscheidung zu gelangen.<br />
Bei einem Signifikanzniveau von α = 0.01 bedeutet dies für die Hypothesen:<br />
H 0 : µ 0 = µ 1 wird verworfen wenn im Fall:<br />
a) HA: µ1 ≠ µ0 v außerhalb eines zentralen 99% Intervalls liegt<br />
b) HA: µ1 < µ0 v kleiner als der 1% Wert ist.<br />
c) HA: µ1 > µ0 v größer als der 99% Wert ist.<br />
n<br />
0,45<br />
0,40<br />
0,35<br />
0,30<br />
0,25<br />
0,20<br />
0,15<br />
0,10<br />
0,05<br />
0,00<br />
-5 -4 -3 -2 -1 0 1 2 3 4 5<br />
Es müssen also folgende Sachverhalte für die drei unterschiedlichen Fragestellungen<br />
bestimmt werden:<br />
H 0 : µ 1 = µ 0 ist zu verwerfen<br />
a) gegen H A : µ 1 ≠ µ 0 falls v < -X 1-α/2 oder v > X 1- α/2<br />
c) gegen HA: µ 1 < µ 0 falls v < -X 1- α<br />
d) gegen HA: µ 1 > µ 0 falls v > X 1- α<br />
11-4
Beispiel: Als Stichprobenmittel der n=25 Flaschen wurde eine Füllmenge von 499.28<br />
cm³ ermittelt.<br />
Damit berechnet sich v nach:<br />
X − µ<br />
0<br />
499.28 − 500<br />
v = n =<br />
25 = −2.4<br />
σ<br />
1.5<br />
Die Werte der Standardnormalverteilung für:<br />
-X( 1- α /2), X( 1- α /2), -X( 1- α ) und X( 1- α ) werden wie in der letzten Sitzung dargestellt aus<br />
Tabellen ermittelt. Es ergibt sich:<br />
Für a.)<br />
-X( 1- α /2) = -X(0.995) = -2.575 und<br />
X( 1- α /2) = X(0.995) = 2.575<br />
Für b.)<br />
-X( 1- α ) = -X(0.99) = -2.327<br />
Für c.)<br />
X( 1- α ) = X(0.99) = 2.327<br />
Entscheidung<br />
Mit den berechneten Parametern lassen sich nun die Hypothesen prüfen:<br />
H 0 : µ 1 = µ 0 ist zu verwerfen<br />
a) gegen H A : µ 1 ≠ µ 0 falls -2.4 < -2.575 oder 2.4 > 2.575<br />
b) gegen H A : µ 1 < µ 0 falls -2.4 < -2.372<br />
c) gegen H A : µ 1 > µ 0 falls 2.4 > 2.372<br />
Die Ergebnisse lassen sich folgendermaßen interpretieren:<br />
a) Die Eichkommission kommt zum Schluss, dass die mittlere Füllmenge der<br />
Stichprobe dem Sollwert entspricht.<br />
b) Die Verbraucherschutzkommission kommt zum Schluss, dass die mittlere<br />
Füllmenge nicht dem Sollwert entspricht.<br />
c) Der Brauereibesitzer kommt zum Schluss, die mittlere Füllmenge entspricht<br />
dem Sollwert.<br />
<strong>11.</strong>3.2. Der t-Test<br />
Der t-Test kommt zur Anwendung, wenn ein Mittelwerttest mit einer Stichprobe (mit n<br />
≤ 30) aus einer Grundgesamtheit, bei der σ oder σ² nicht bekannt ist, durchgeführt<br />
werden soll.<br />
Der Testfunktionswert v ergibt sich dabei nach:<br />
11-5
X − µ<br />
s<br />
v<br />
0<br />
=<br />
Anstelle der unbekannten Standardabweichung σ der Grundgesamtheit wird hier die<br />
Standardabweichung der Stichprobe s benutzt. Sie berechnet sich nach:<br />
n<br />
s<br />
=<br />
1<br />
n −1<br />
n<br />
∑<br />
i=<br />
1<br />
( x i<br />
− x)<br />
2<br />
Die t-Verteilung ist der Standardnormalverteilung sehr ähnlich. Ihre Funktionswerte<br />
sind von der Anzahl der Freiheitsgrade abhängig. Mit zunehmenden FG nähert sie<br />
sich immer mehr der SNV an.<br />
Die FG berechnen sich aus dem Stichprobenumfang n nach:<br />
FG<br />
= n −1<br />
0.400<br />
0.350<br />
0.300<br />
FG = 3<br />
FG = 7<br />
FG = 25<br />
0.250<br />
0.200<br />
0.150<br />
0.100<br />
0.050<br />
0.000<br />
-4 -3 -2 -1 0 1 2 3 4<br />
Beispiel für die Anwendung des t-Tests:<br />
Zehn Hohlkarabiner einer bestimmten Marke wurden der Produktion entnommen und<br />
dem Zerreißversuch unterzogen, d.h. die Belastung des Karabiners wurde solange<br />
erhöht, bis er brach. Der Bruch geschah bei folgenden Werten x i :<br />
2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp]<br />
Aus versicherungstechnischen Gründen soll nun überprüft werden, ob der vom Hersteller<br />
angegebene Sollwert von 2000 kp mit 99%iger Sicherheit gewährleistet ist.<br />
Daraus ergeben sich als Hypothesen:<br />
H 0 : µ 1 = µ 0 Der Mittelwert der Stichprobe entspricht dem Sollwert<br />
H A : µ 1 < µ 0 Der Mittelwert der Stichprobe ist signifikant kleiner<br />
11-6
Aus der 99%igen Sicherheit ergibt sich das Signifikanzniveau: α = 0.01<br />
Aus dem Stichprobenumfang ergeben sich die Freiheitsgrade: FG = n – 1 = 9<br />
Zunächst müssen nun der Mittelwert und die Standardabweichung der Stichprobe<br />
bestimmt werden:<br />
n<br />
1<br />
2<br />
µ<br />
1<br />
= ∑ X i<br />
= 2164 s = ∑(<br />
x i<br />
− x)<br />
= 2960 = 54. 4<br />
n<br />
n −1<br />
1 10 i= 1<br />
i=<br />
1<br />
Und dann der Testwert berechnet werden:<br />
X − µ 2164 − 2000<br />
v = 0 n =<br />
10 9.53<br />
s<br />
54.4<br />
=<br />
Der Wert der t-Verteilung für FG = 9 und α = 0.01 wird der Tabelle entnommen und<br />
beträgt: 2.8214<br />
Entscheidung:<br />
Nullhypothese wird beibehalten da: t(9;0.01) < v (2.8214 < 9.53)<br />
Der Hersteller geht also davon aus, dass seine Karabiner dem Sollwert entsprechen.<br />
<strong>11.</strong>3.4. Der χ²-Test für Varianzen<br />
Der χ²-Test kommt zur Anwendung, wenn ein Varianzentest mit einer Stichprobe aus<br />
einer normalverteilten Grundgesamtheit durchgeführt werden soll.<br />
Der Testfunktionswert v ergibt sich dabei nach:<br />
2<br />
s<br />
v = ( n −1)<br />
2<br />
σ<br />
0<br />
1<br />
=<br />
σ<br />
2<br />
0<br />
⋅<br />
n<br />
∑<br />
i=<br />
1<br />
( x i<br />
− x)<br />
Wobei s² wiederum die Varianz der Stichprobe, σ² dagegen die Varianz der Grundgesamtheit<br />
darstellt.<br />
Die χ²-Verteilung ist eine linksteile/rechtschiefe Verteilung die einen ausschließlich<br />
positiven Wertebereich besitzt. Ihre Funktionswerte sind wie bei der t-Verteilung von<br />
der Anzahl der Freiheitsgrade abhängig.<br />
Die FG berechnen sich aus dem Stichprobenumfang n nach:<br />
FG = n −1<br />
2<br />
11-7
Beispiel für die Anwendung des t-Tests:<br />
Zehn Hohlkarabiner einer bestimmten Marke wurden der Produktion entnommen und<br />
dem Zerreißversuch unterzogen, d.h. die Belastung des Karabiners wurde solange<br />
erhöht, bis er brach. Der Bruch geschah bei folgenden Werten x i :<br />
2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp]<br />
Der Hersteller möchte wissen, ob die vom Maschinenhersteller angegebene Streuung<br />
von σ 0 = 40 im Durchschnitt bei 95% der Produktion erreicht wird oder nicht.<br />
Hypothesen:<br />
H 0 : σ² 1 = σ² 0<br />
H A : σ² 1 ≠ σ² 0<br />
Signifikanzniveau:<br />
α = 0.05<br />
Freiheitsgrade:<br />
FG = 10 – 1 = 9<br />
Mittelwert und Standardabweichung der Stichprobe:<br />
n<br />
1<br />
2<br />
µ<br />
1<br />
= ∑ X i<br />
= 2164 s = ∑(<br />
x i<br />
− x)<br />
= 2960 = 54. 4<br />
n<br />
n −1<br />
1 10 i= 1<br />
Testgröße v:<br />
2<br />
n<br />
s 1<br />
v = ( n −1)<br />
= ⋅ ( − )<br />
2 2 ∑ x i<br />
x<br />
σ σ<br />
0<br />
0<br />
i=<br />
1<br />
i=<br />
1<br />
2<br />
=<br />
1<br />
1600<br />
26640 = 16.65<br />
11-8
Die Werte der χ²-Verteilung für FG=9 an den Signifikanzstellen werden der Tabelle<br />
entnommen und betragen:<br />
χ²(0.025; 9) = 2.7 und χ²(0.975; 9) = 19.023<br />
Entscheidung:<br />
Auch in diesem Fall kann die Nullhypothese beibehalten werden da:<br />
2<br />
2<br />
χ (0.025;9) < v < χ (0.975;9)<br />
2.70 < 16.65 < 19.023<br />
Zur Veranschaulichung können die Werte auch retransformiert werden mit:<br />
2<br />
² = v ⋅σ<br />
0<br />
s<br />
( n −1)<br />
Dadurch ergibt sich das Werteintervall: 22 < 40 < 58<br />
Das bedeutet die Standardabweichung der Stichprobe liegt im Intervall. Damit weicht<br />
sie nicht signifikant von der Sollgröße ab.<br />
11-9
<strong>11.</strong>4. Übungsaufgaben<br />
Aufgabe 1:<br />
Die mittlere Länge von 18 Lorbeerblätter ist 151 mm und die Standardabweichung ist<br />
15 mm. Wenn sie die Länge als normalverteilt annehmen, dann bestimmen Sie, wie<br />
viele Lorbeerblätter:<br />
a) Welche Verteilungsfunktion legen Sie für die Stichprobe zugrunde.<br />
b) zwischen 115 und 145 mm lang sind<br />
c) über 183 mm lang sind.<br />
Aufgabe 2:<br />
Ein Test der Bruchstärken von 6 Seilen, die von einer Firma hergestellt wurden, ergab<br />
eine mittlere Bruchstärke von 7750 N bei einer Standardabweichung von 145 N,<br />
während der Hersteller eine mittlere Bruchstärke von 8000 N behauptete.<br />
Können Sie bei einer Irrtumswahrscheinlichkeit von<br />
a) 0.05<br />
b) 0.01<br />
Diese Behauptung des Herstellers unterstützen?<br />
Aufgabe 3:<br />
Eine einfache Stichprobe vom Umfang 16 aus einer NV(µ, 2.5) verteilten Grundgesamtheit<br />
ergab den Mittelwert 998.2875.<br />
Testen Sie jeweils zum Signifikanzniveau α = 0.05 mit Hilfe des Gausstest:<br />
a) H 0 : µ = 1000 gegen H 1 µ ≠ 1000<br />
b) H 0 : µ ≥ 1000 gegen H 1 µ < 1000<br />
c) H 0 : µ ≤ 1000 gegen H 1 µ > 1000<br />
Aufgabe 4:<br />
Die mittlere Lebensdauer einer Stichprobe von 100 Glühbirnen, die von einer Firma<br />
hergestellt wurden, wurden mit 1570 Stunden bei einer Standardabweichung von 120<br />
Stunden berechnet. Der Hersteller vermutet, dass die mittlere Lebensdauer seiner<br />
Glühbirnen betrage 1600 Stunden betrage. Nun möchte er mit 95 %iger Sicherheit<br />
feststellen, ob diese Vermutung richtig ist.<br />
a) Stellen Sie einen geeigneten Test auf, indem Sie die Hypothesen formulieren,<br />
einen geeigneten Test wählen, dann den Test durchführen und schließlich Ihr<br />
Ergebnis in einem kurzen Text darstellen.<br />
11-10
) Die Verbraucherschutzministerin möchte wissen, wie hoch die Lebensdauer<br />
von mindestens 80% der Produktion ist. Bestimmen Sie diesen Wert für Frau<br />
Kühnast.<br />
Aufgabe 5:<br />
Bei wie vielen von 800 Familien mit 5 Kindern würden Sie:<br />
a) 3 Jungen<br />
b) 5 Mädchen<br />
c) 2 oder 3 Jungen erwarten?<br />
Wobei die Wahrscheinlichkeit für die Geburt eines Jungens gleich der für die Geburt<br />
eines Mädchens sei.<br />
Aufgabe 6:<br />
In folgender Abbildung ist die χ²-Quadrat Verteilung mit 5 Freiheitsgraden dargestellt.<br />
Bestimmen Sie die kritischen Werte von χ 2 , für die<br />
a) die Fläche rechts von Grenze 2 = 0.05 ist<br />
b) die Fläche links von Grenze 1 = 0.10 ist<br />
c) die Fläche rechts von Grenze 2 = 0.01 ist<br />
d) die Flächen rechts von Grenze 2 und links von Grenze 2 gemeinsam = 0.05<br />
ist<br />
(Hinweis zur Frage d): es gibt viele<br />
kritische Werte, für die die gesamte<br />
schraffierte Fläche gleich 0.05 ist.<br />
Nehmen Sie an, dass die beiden<br />
Flächen die gleiche Größe<br />
Grenze 1<br />
Grenze 2<br />
Aufgabe 7:<br />
Die Standardabweichung der Körpergrößen von 16 Schülern, die zufällig in einer<br />
Schule von 1000 Schülern gewählt wurden, war 2.40 cm. Bestimmen Sie die<br />
a.) 95%<br />
b.) 99%<br />
Konfidenzgrenzen für die Standardabweichung aller Schüler dieser Schule.<br />
Aufgabe 8<br />
In der Vergangenheit waren Mittelwert und Standardabweichung der Schneehöhe in<br />
Sibirien 40 cm bzw. 2.5 cm. Eine Zufallsstichprobe von 20 Messwerten im Jahr 2002<br />
ergab eine Standardabweichung von 3.2 cm. Prüfen Sie, bei einer Irrtumswahrscheinlichkeit<br />
von<br />
11-11
a.) 0.05<br />
b.) 0.01<br />
ob die scheinbare Erhöhung der Streuung signifikant ist?<br />
<strong>11.</strong>5. Musterlösung zu den Übungsaufgaben<br />
Aufgabe 1:<br />
Die mittlere Länge von 18 Lorbeerblätter ist 151 mm und die Standardabweichung ist<br />
15 mm. Wenn sie die Länge als normalverteilt annehmen, dann bestimmen Sie, wie<br />
viele Lorbeerblätter:<br />
a) Welche Verteilungsfunktion legen Sie für die Stichprobe zugrunde.<br />
Lösung: Das nur 18 Elemente in der Stichprobe vorliegen muss anstelle der Normalverteilung<br />
die t-Verteilung angewendet werden.<br />
b) zwischen 115 und 145 mm lang sind<br />
Die Vorgehensweise ist analog zur Vorgehensweise bei der Normalverteilung, mit dem<br />
Unterschied, dass die t-Verteilung über ihre Freiheitsgrade definiert ist. Diese ergeben<br />
sich aus dem Stichprobenumfang nach FG = n – 1. Also 17 Freiheitsgrade.<br />
Nun müssen die realen Werte in t-Verteilungswerte transformiert werden, nach:<br />
( X − µ )<br />
v= ⋅ n<br />
σ<br />
(115 −151)<br />
v(115) = ⋅ 18 =−10.18<br />
15<br />
(145 −151)<br />
v(145) = ⋅ 18 =−1.697<br />
15<br />
Für diese Werte können nun die tabellierten t-Verteilungswerte (FG 17) in der Tabelle in<br />
der Formelsammlung nachgesehen werden. Ein Problem dabei stellt der Wert von -10.18<br />
bzw. +10.18 dar, da er nicht tabelliert ist. Dies liegt daran, dass dieser Wert sehr weit<br />
außen in der t-Verteilung liegt und daher sehr klein bzw. sehr groß ist. In solch einem Fall<br />
kann der Wert mit 0 angenommen werden. Wir lesen also aus der Tabelle<br />
tV(-10.18) = 0 und tV(-1.697) = (1 - 0.94) = 0.06.<br />
Somit können wir folgern, dass 6% der Blätter eine Länge von 115 – 145 mm besitzen. Also<br />
maximal 1 Blatt.<br />
c) über 183 mm lang sind.<br />
Lösung: Der Funktionswert der t-Verteilung ist v(183) = +9.05. Auch dieser Wert ist<br />
nicht tabelliert. Daraus lässt sich folgern, dass die Wahrscheinlichkeit ein Blatt von einer<br />
Länge 183 mm in der Stichprobe vorzufinden, verschwindend gering ist. Die Berechnung<br />
mit Excel ergibt eine Wahrscheinlichkeit von 3.27 * 10 -8<br />
11-12
Aufgabe 2:<br />
Ein Test der Bruchstärken von 6 Seilen, die von einer Firma hergestellt wurden, ergab<br />
eine mittlere Bruchstärke von 7750 N bei einer Standardabweichung von 145 N,<br />
während der Hersteller eine mittlere Bruchstärke von 8000 N behauptete.<br />
Können Sie bei einer Irrtumswahrscheinlichkeit von<br />
a) 0.05<br />
b) 0.01<br />
Diese Behauptung des Herstellers unterstützen?<br />
Lösung: Hier handelt es sich um eine klassische Testaufgabe.<br />
Gegeben ist: µ 0 = 8000; σ = 145; µ 1 = 7750; n = 6 sowie die beiden verschiedenen Irrtumswahrscheinlichkeiten<br />
α 1 = 0.05 und α 2 = 0.01<br />
Gefragt ist: Sind die Mittelwerte gleich, was bedeutet die Abweichung ist allein auf die Stichprobenauswahl<br />
zurückzuführen. Oder ist der Mittelwert der Stichprobe (µ 1 ) signifikant kleiner<br />
als der den der Hersteller angab (µ 0 ) also systematisch.<br />
Daraus ergeben sich die Hypothesen:<br />
H 0 : µ 1 = µ 0<br />
H 1 : µ 1 < µ 0<br />
Durchzuführen ist also ein einseitiger Test der Mittelwerte (=Gausstest):<br />
Berechnung des Testwertes nach:<br />
( X −µ ) (7750 −8000)<br />
v= n = 6 =−4.223<br />
σ<br />
145<br />
Bestimmung der Funktionswerte an den Signifikanzstellen. Vorsicht, da der Stichprobenumfang<br />
nur 6 Seile beträgt muss die t-Verteilung mit n-1 Freiheitsgraden gewählt werden!<br />
Für das Signifikanzniveau α 1 = 0.05 bei 5 FG entnehmen wir den Wert: -2.01<br />
Für das Signifikanzniveau α 2 = 0.01 bei 5 FG entnehmen wir den Wert: -3.36<br />
Wir können diese Werte nun mit dem Testwert vergleichen:<br />
a) Ist -4.223 kleiner als -2.01 ?<br />
b) Ist -4.223 kleiner als -3.36 ?<br />
In beiden Fällen ist dies Wahr. Daraus folgt, dass die Alternativhypothese H 1 richtig ist und<br />
die Nullhypothese H 0 zu verwerfen ist.<br />
Dies bedeutet der Mittelwert der aus der Stichprobe ermittelt wurde weicht beide Male signifikant<br />
von der Herstellerangabe ab. Die Seile sind also weniger belastbar als der Hersteller<br />
angibt.<br />
Anschaulicher lassen sich die Werte vergleichen, wenn Sie zunächst retransformiert werden<br />
nach:<br />
11-13
X = v ⋅σ+µ<br />
n<br />
X 2.01<br />
1<br />
= − ⋅ 145 + 8000 = 7881<br />
6<br />
X 3.36<br />
2<br />
= − ⋅ 145 + 8000 = 7801<br />
6<br />
Die Ergebnisse zeigen dass der Mittelwert der Stichprobe (7750) beide Male deutlich kleiner<br />
ist als die Testwerte.<br />
Aufgabe 3:<br />
Eine einfache Stichprobe vom Umfang 16 aus einer NV(µ, 2.5) verteilten Grundgesamtheit<br />
ergab den Mittelwert 998.2875.<br />
Testen Sie jeweils zum Signifikanznievau α = 0.05 mit Hilfe des Gausstest:<br />
a) H 0 : µ = 1000 gegen H 1 µ ≠ 1000<br />
b) H 0 : µ ≥ 1000 gegen H 1 µ < 1000<br />
c) H 0 : µ ≤ 1000 gegen H 1 µ > 1000<br />
Lösung:<br />
Gegeben n = 16 (also t-verteilte Testgröße); µ = 998.2875; σ = 2.5; α = 0.05<br />
( X −µ ) (998.2875 −1000)<br />
Berechnen der Testgröße v: v= n = 16 =−2.74<br />
σ<br />
2.5<br />
Für a)<br />
Zweiseitiger Test da Ungleichheit gefragt:<br />
Hierfür werden die Werte der t-Verteilung an den Stellen 0.025 und 0.975 bei 15 Freiheitsgraden<br />
benötigt und werden aus der Tabelle bestimmt nach:<br />
t(0.025, 15) = -2.1315 und t(0.975, 15) = 2.1315<br />
Nun wird geprüft ob der Testwert im Intervall liegt: -2.1315 ?< -2.74 ?< 2.1315<br />
Wir stellen fest, er liegt außerhalb. Das bedeutet er ist signifikant unterschiedlich, damit wird<br />
H 1 angenommen und H 0 verworfen.<br />
Für b)<br />
Einseitiger Test da Kleiner Beziehung in H 1 gefragt:<br />
Wert der t-Verteilung an der Stelle 0.05: t(0.05, 15) = -1.7531<br />
Wir prüfen mit der Alternativhypothese ob der Testwert kleiner als der Wert der T-Funktion: -<br />
2.74 ?< -1.7531.<br />
Wir stellen fest, dies ist wahr. Deshalb nehmen wir die Alternativhypothese an und verwerfen<br />
die Nullhypothese. µ ist signifikant kleiner als 1000 und nicht signifikant größer.<br />
11-14
Für c)<br />
Einseitiger Test da Größer Beziehung in H 1 gefragt:<br />
Wert der t-Verteilung an der Stelle 0.95: t(0.95, 15) = 1.7531<br />
Wir prüfen mit der Alternativhypothese ob der Testwert kleiner als der Wert der T-Funktion:<br />
-2.74 ?> 1.7531.<br />
Wir stellen fest, dies ist falsch. Deshalb verwerfen wir die Alternativhypothese und nehmen<br />
die Nullhypothese an. µ ist nicht signifikant größer als 1000 sondern signifikant kleiner.<br />
Aufgabe 4:<br />
Die mittlere Lebensdauer einer Stichprobe von 100 Glühbirnen, die von einer Firma<br />
hergestellt wurden, wurden mit 1570 Stunden bei einer Standardabweichung von 120<br />
Stunden berechnet. Der Hersteller vermutet, dass die mittlere Lebensdauer seiner<br />
Glühbirnen 1600 Stunden betrage. Nun möchte er mit 95 %iger Sicherheit feststellen,<br />
ob diese Vermutung richtig ist.<br />
a) Stellen Sie einen geeigneten Test auf, indem Sie die Hypothesen formulieren,<br />
einen geeigneten Test wählen, dann den Test durchführen und schließlich Ihr<br />
Ergebnis in einem kurzen Text darstellen.<br />
Lösung: Gegeben n = 100; µ 0 = 1600, σ = 120; µ 1 = 1570; α = 0.05<br />
Der Hersteller fragt sich ob der berechnete Mittelwert signifikant von seiner Vermutung<br />
abweicht. Daraus ergeben sich die Hypothesen:<br />
H 0 : µ 0 = µ 1<br />
H 1 : µ 0 ≠ µ 1<br />
Aus den Hypothesen ergibt sich ein zweiseitiger Test, mit der Testgröße:<br />
( X −µ ) (1570 −1600)<br />
v= n = 100 =−2.5<br />
σ<br />
120<br />
Da die Mittelwerte bei ausreichend großer Stichprobe ( >30) normalverteilt sind wird der<br />
Testwert mit der SNV an den Stellen (0.025) und (0.975), nämlich dem 95% Intervall um<br />
den Wert verglichen.<br />
SNV(0.025) = -1.96 und SNV(0.975) = 1.96<br />
Nun prüfen wir ob der Wert im Intervall liegt und stellen fest, er liegt außerhalb. Deshalb<br />
nehmen wir die Alternativhypothese an und verwerfen die Nullhypothese. Die Mittelwerte<br />
sind also signifikant unterschiedlich. Der Hersteller liegt also mit seiner Annahme falsch.<br />
b) Die Verbraucherschutzministerin möchte wissen, wie hoch die Lebensdauer<br />
von mindestens 80% der Produktion ist. Bestimmen Sie diesen Wert für Frau<br />
Kühnast.<br />
Lösung: Hier ist einfach eine Intervallschätzung gefragt. KEIN TEST!!<br />
Hierfür überführen wir die gegebene Normalverteilung in eine SNV, bzw. überführen<br />
den Wert der SNV an der Stelle 0.8 SNV(0.8) = 0.845 in die Normalverteilung nach:<br />
X = Z ⋅σ+µ= 0.845⋅ 120 + 1570 = 1671<br />
11-15
Wir können Frau Kühnast also mitteilen, dass die Lebensdauer von 80% der Produktion<br />
zwischen 0 und 1671 Stunden liegt.<br />
Aufgabe 5:<br />
Bei wie vielen von 800 Familien mit 5 Kindern würden Sie:<br />
a) 3 Jungen<br />
b) 5 Mädchen<br />
c) 2 oder 3 Jungen erwarten?<br />
Wobei die Wahrscheinlichkeit für die Geburt eines Jungens gleich der für die Geburt<br />
eines Mädchens sei.<br />
Lösung: Gesucht sind Erwartungswerte einer Binominalverteilung mit unterschiedlichen<br />
Wahrscheinlichkeiten p die zunächst ausgerechnet werden müssen.<br />
Gegeben ist also zunächst eine BNV(0.5, 5)<br />
Die Wahrscheinlichkeit für berechnet sich damit für<br />
a)<br />
⎛5⎞<br />
3 2<br />
f (3) = ⎜ 0.5 ⋅ 0.5 = 10 ⋅0.125⋅ 0.25 = 0.3125<br />
3<br />
⎟<br />
⎝ ⎠<br />
b)<br />
⎛5⎞<br />
0 5<br />
f (0) = ⎜ 0.5 ⋅ 0.5 = 1⋅1⋅ 0.03125 = 0.03125<br />
0<br />
⎟<br />
⎝ ⎠<br />
c)<br />
f (2) + f (3) = 0.3125 + 0.3125 = 0.625<br />
Daraus ergeben sich nun die zu erwartenden Werte:<br />
a) n * f(3) = 800 * 0.3125 = 250 Es können also bei 250 Familien 3 Jungen erwartet<br />
werden.<br />
b) n * f(0) = 800 * 0.03125 = 25 Es können also bei 25 Familien 5 Mädchen erwartet<br />
werden.<br />
c) n * (f(2) + f(3)) = 800 * 0.625 = 500 Es können also bei 500 Familien 2 oder 3<br />
Jungen erwartet werden.<br />
11-16
Aufgabe 6<br />
Das Schaubild der Chi-Quadrat Verteilung mit 5 Freiheitsgraden ist in der Abbildung<br />
dargestellt. Bestimmen Sie die kritischen Werte von χ 2 , für die<br />
a.) die Fläche rechts von Grenze 2 = 0.05 ist<br />
b.) die Fläche links von Grenze 1 = 0.10 ist<br />
c.) die Fläche rechts von Grenze 2 = 0.01 ist<br />
d.) die Flächen rechts von Grenze 2 und links von Grenze 2 gemeinsam = 0.05<br />
ist<br />
(Hinweis zur Frage d): es gibt viele<br />
kritische Werte, für die die gesamte<br />
schraffierte Fläche gleich 0.05 ist.<br />
Nehmen Sie an, dass die beiden<br />
Flächen die gleiche Größe haben).<br />
Grenze 1<br />
Grenze 2<br />
Lösung: Die Gesamtfläche unter der Verteilung beträgt 1.<br />
a) Wenn die Fläche rechts von G2 0.05 sein soll ergibt sich die linke Seite als 1-0.05 also<br />
0.95. Dieser Wert kann aus der Tabelle abgelesen werden bei 5 FG und ergibt<br />
χ²(0.95;5) = <strong>11.</strong>070.<br />
b) χ²(0.1;5) = 0.554<br />
c) wie a) χ²(0.99;5) = 15.086<br />
d) χ²(0.025;5) = 0.831 und χ²(0.975;5) = 12.832<br />
Aufgabe 7<br />
Die Standardabweichung der Körpergrößen von 16 Schülern, die zufällig in einer<br />
Schule von 1000 Schülern gewählt wurden, war 2.40 cm. Bestimmen Sie die<br />
a.) 95%<br />
b.) 99%<br />
Konfidenzgrenzen für die Standardabweichung aller Schüler dieser Schule.<br />
Lösung: Paramtertest auf Varianz<br />
Aus s = 2.4 folgt s² = 5.76. Die Umstellung der Testfunktion nach 0 ² ergibt:<br />
v<br />
( n 1)<br />
s<br />
= − σ<br />
2<br />
2<br />
s −<br />
0<br />
σ =<br />
2<br />
2<br />
0<br />
( n 1)<br />
v<br />
11-17
für a) ergeben sich folgende χ²-Werte χ²(0.975;15) = 27.488 und χ²(0.025;15) = 6.262.<br />
Einsetzen in die Gleichung ergibt:<br />
( )<br />
2<br />
5.76 15<br />
σ<br />
0.025<br />
= = 13.79<br />
6.262<br />
2<br />
5.76( 15)<br />
σ<br />
0.975<br />
= = 3.143<br />
27.488<br />
Durch Wurzelziehen erhalten wir wieder die Standardabweichungen. Wir können also mit<br />
95%iger Sicherheit sagen, dass die Standardabweichung der Grundgesamtheit zwischen 1.77<br />
cm und 3.71 cm liegt.<br />
für b) ergeben sich folgende χ²-Werte χ²(0.995;15) = 32.801 und χ²(0.005;15) = 4.601.<br />
Einsetzen in die Gleichung ergibt:<br />
( )<br />
2<br />
5.76 15<br />
σ<br />
0.005<br />
= = 18.78<br />
4.601<br />
2<br />
5.76( 15)<br />
σ<br />
0.995<br />
= = 2.634<br />
32.801<br />
Durch Wurzelziehen erhalten wir wieder die Standardabweichungen. Wir können also mit<br />
99%iger Sicherheit sagen, dass die Standardabweichung der Grundgesamtheit zwischen 1.63<br />
cm und 4.33 cm liegt.<br />
Aufgabe 8<br />
In der Vergangenheit waren Mittelwert und Standardabweichung der Schneehöhe in<br />
Sibirien 40 cm bzw. 2.5 cm. Eine Zufallsstichprobe von 20 Messwerten im Jahr 2002<br />
ergab eine Standardabweichung von 3.2 cm. Prüfen Sie, bei einer Irrtumswahrscheinlichkeit<br />
von<br />
a.) 0.05<br />
b.) 0.01<br />
ob die scheinbare Erhöhung der Streuung signifikant ist?<br />
Lösung:<br />
Geg: µ0 = 40; σ = 2.5; n = 20; s = 3.2 σ² = 6.25 und s² = 10.24<br />
Gefr: Ist s² signifikant größer als σ²<br />
1. Hypothesen: H0: s² > σ² gegen H1: s² < σ²<br />
2<br />
s 10.24<br />
2. Berechnung des Testwertes: v= ( n− 1)<br />
= 19 ⋅ = 31.13<br />
2<br />
σ0<br />
6.25<br />
3. Bestimmung des Funktionswertes an der Konfidenzstelle:<br />
a. für 0.05 χ²(0.95; 19) = 30.144<br />
11-18
. für 0.01 χ²(0.99; 19) = 36.191<br />
4. Entscheidung:<br />
a. v ?