13.07.2015 Aufrufe

Statistische Tests - ETH

Statistische Tests - ETH

Statistische Tests - ETH

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>ETH</strong>Z 90-683Dr. M. Müller<strong>Statistische</strong> MethodenWS 2000/011 Begriffe und Vorgehensweise<strong>Statistische</strong> <strong>Tests</strong>AllgemeinBeispiel1. Problem formulieren:Nullhypothese H 0 festlegen2. Alternativen bestimmen:Alternativhypothese H A3. zu beobachtende Grösse festlegen:<strong>Tests</strong>tatistik T4. Wahrscheinlichkeitsverteilung von Tunter H 0 bestimmen5. Menge aller “extremen” Beobachtungendefinieren:Verwerfungsbereich K mit Signifikanzniveauα6. Daten erheben, Wert von T berechnen:T = t7. P-Wert berechnen8. Entscheidung:t im Verwerfungbereich: verwerfe H 0t im Annahmebereich: behalte H 0 beiErläuterungen:1. Wir nehmen an, dass kein Effekt oder Unterschied vorhanden ist und versuchen Evidenzgegen diese Annahme, die Nullhypothese H 0 , zu finden. Die Nullhypothese ist das zuüberprüfende Modell und besteht meistens aus einer Verteilungsannahme und einerAussage über einen Parameter.2. Weil man Evidenz gegen und nicht für etwas sucht, entspricht die Alternativhypotheseder Arbeitshypothese. Die Nullhypothese möchte man möglichst widerlegen.3. Die <strong>Tests</strong>tatistik basiert meistens auf einer Schätzung des Parameters, der in Null- undAlternativhypothese auftritt.5. Das Signifikanzniveau α (significance level) ist gleich der Wahrscheinlichkeit, ein ”extremes“Resultat zu erhalten, unter der Annahme, dass H 0 stimmt. Je grösser alsoα gewählt wird, desto grösser ist der Verwerfungsbereich und umgekehrt. Üblich sindα = 5% oder α = 1%. Das Komplement zum Verwerfungsbereich heisst Annahmebereich.7. Der P -Wert (p-value) ist die Wahrscheinlichkeit, dass in einem neuen Versuch einmindestens so extremes Resultat herauskommt, unter der Annahme, dass H 0 richtigist. Der P -Wert ist nicht die Wahrscheinlichkeit, dass H 0 richtig ist. Einer Hypothesekann gar keine Wahrscheinlichkeit zugeordnet werden, sie ist entweder richtig oderfalsch.1


8. Der Wert von T ist genau dann im Verwerfungsbereich, wenn der P -Wert≤ α. Indiesem Fall wird die Nullhypothese abgelehnt oder verworfen. H 0 wird als statistischwiderlegt betrachtet. Der Test ist (statistisch) signifikant.Wenn der P -Wert> α ist, dann liegt der Wert von T im Annnahmebereich und dieDaten sprechen zu wenig gegen H 0 . H 0 kann nicht verworfen werden. Der Test ist nichtsignifikant.Fehler 1. Art: H 0 wird verworfen, obschon H 0 richtig wäre. Die Wahrscheinlichkeit einesFehlers 1. Art ist α und wird auf 5% oder 1% festgelegt.Fehler 2. Art: H 0 wird beibehalten, obschon H A stimmt. Die Wahrscheinlichkeit eines Fehlers2. Art wird meist mit β bezeichnet.Macht: 1 − β ist die Wahrscheinlichkeit, eine wahre Alternativhypothese zu erkennen undheisst die Macht des <strong>Tests</strong> (power).2 <strong>Tests</strong> für Lageparameter2.1 z-TestSeien X 1 , . . . , X n unabhängig normalverteilt mit Erwartungswert µ und bekannter Varianzσ 2 . Betrachte die folgenden Hypothesen:H 0 : µ = µ 0H A : µ ≠ µ 0 .Die <strong>Tests</strong>tatistik des z-<strong>Tests</strong> ist:Z = ¯X − µ 0σ/ √ n , unter H 0 standardnormalverteilt.2.2 t-Test für eine StichprobeSeien X 1 , . . . , X n unabhängig normalverteilt mit Erwartungswert µ und unbekannter Varianz.Betrachte die folgenden Hypothesen:H 0 : µ = µ 0H A : µ ≠ µ 0 .Die <strong>Tests</strong>tatistik des t-<strong>Tests</strong> ist:t = ¯X − µ 0S/ √ n , unter H 0 t-verteilt mit n − 1 Freiheitsgraden (degrees of freedom).2.3 Vorzeichentest (sign test)Seien X 1 , . . . , X n iid mit Median m.H 0 : m = µ 0H A : m ≠ µ 0 .Zur Berechnung der <strong>Tests</strong>tatistik T wird von jedem Wert µ 0 subtrahiert. Dann ist T dieAnzahl positiver (oder negativer) Beobachtungen; T ∼ B(n, 0.5).2


2.4 Wilcoxontest (Rangsummentest, signed rank test)Seien X 1 , . . . , X n iid stetige, symmetrisch verteilte Zufallsvariablen mit Median m.H 0 : m = µ 0H A : m ≠ µ 0 .Zuerst wird von allen Beobachtungen µ 0 subtrahiert. Die Werte werden dann dem Absolutbetragnach geordnet und die zugehörigen Ränge bestimmt. Sind mehrere Werte gleichgross, werden die Ränge gemittelt.Die <strong>Tests</strong>tatistik ist die Rangsumme aller positiven (oder negativen) Werte T + (oder T − ).Es gibt Tabellen mit den kritischen Werten; für n > 30 Normalapproximation.2.5 t-Test für zwei unabhängige StichprobenSeien X 1 , . . . , X n unabhängig normalverteilt mit Erwartungswert µ X und Varianz σ 2 undY 1 , . . . , Y m unabhängig normalverteilt mit Erwartungswert µ Y und Varianz σ 2 . Die Y i seienunabhängig von den X i .H 0 : µ X = µ YH A : µ X ≠ µ Y .Die <strong>Tests</strong>tatistik des t-<strong>Tests</strong> ist:¯X −t = √ ȲS 1 p n + 1 mmit S 2 p = (n − 1)S2 X + (m − 1)S2 Yn + m − 2Unter H 0 ist t t-verteilt mit n + m − 2 Freiheitsgraden.2.6 Mann-Whitney-Test (Rangsummentest, rank sum test)Seien X 1 , . . . , X n iid stetige Zufallsvariablen mit Erwartungswert µ X und Y 1 , . . . , Y m iidstetige Zufallsvariablen mit Erwartungswert µ Y . Die Y i seien unabhängig von den X i .H 0 : µ X = µ YH A : µ X ≠ µ Y .Bestimme die Rangsummen T (1) der X i und T (2) der Y i in der ”gemeinsamen“ Stichprobe.SetzeU (1) = T (1) −n(n + 1), U (2) = T (2) m(m + 1)−22Die kritischen Werte für U sind tabelliert.und U = min(U (1) , U (2) ).3 Dualität zwischen <strong>Tests</strong> und VertrauensintervallenBei einem Test lautet die Frage: ”Welche Beobachtungen sind vereinbar mit H 0 , bzw. einemParameterwert µ 0 ?“ Der Annahmebereich liefert die Antwort.Umgekehrt wird bei einem Vertrauensintervall gefragt: ”Welche Parameter sind vereinbarmit den Beobachtungen?“ Alle diese Parameterwerte bilden dann das Vertrauensintervall.Satz 3.1 (Dualitätssatz)Ein Test mit Signifikanzniveau α verwirft H 0 : µ = µ 0 genau dann nicht, wenn µ 0 innerhalbdes (1 − α)100%-Vertrauensintervalls liegt.3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!