Schließende Statistik - Fachrichtung Mathematik

Schließende Statistik 

[statistical inference] 

Sollen auf der Basis von empirischen Untersuchungen (Daten) 

Erkenntnisse gewonnen und Entscheidungen gefällt werden, 

sind die Methoden der Statistik einzusetzen. 

Statistik 

✄ Beschreibende Statistik 

✄ Beschreibung von Daten (Deskription) 

✄ Generierung von Hypothesen (Exploration) 

✄ Schließende Statistik: Schluss von den Daten einer 

Stichprobe auf die Grundgesamtheit 

1

Grundlage der schließenden Statistik ist ein stochastisches 

Modell für die Verhältnisse in der Grundgesamtheit. 

Aufgaben der schließenden Statistik: 

– möglichst gute Anpassung eines Modells an die 

beobachteten Daten (die Realität); Schätzung des Modells. 

– Überprüfung von Modellannahmen (Hypothesen) über die 

Grundgesamtheit; z.B. über die Verteilungen der 

Merkmalsausprägungen interessierender Merkmale in der 

Grundgesamtheit. Zur Anwendung kommen 

Entscheidungsregeln (z.B. Signifikanztests), die auf der 

Basis der vorliegenden Stichprobendaten zu 

Entscheidungen über diese Annahmen führen. 

2

Schließende Statistik (Inferenzstatistik, 

konfirmatorische Verfahren) 

Hauptrichtungen: 

– Schätzen [estimation of parameters] unbekannter 

Parameter im Modell, z.B. Wahrscheinlichkeiten (Anteile 

in der Grundgesamtheit), Erwartungswerte 

(Durchschnittswerte in der Grundgesamtheit) oder 

allgemein von Verteilungen interessierender Merkmale in 

der Grundgesamtheit. 

– Testen [testing of hypotheses] von Hypothesen über 

diese Parameter bzw. Verteilungen, d.h. über die 

Angepasstheit eines Modells und damit schließlich über die 

interessierenden Verhältnisse in der Grundgesamtheit. 

3

Jeder Schluss von einer Teilerhebung (Stichprobe) auf die 

Grundgesamtheit ist mit Unsicherheiten verbunden. Die 

wahrscheinlichkeitstheoretischen Modelle ermöglichen es, 

diese Unsicherheiten zu quantifizieren. 

Beispiel: GSTAT (Fred Böker: Statistik lernen am PC 

Vandenhoeck & Ruprecht 1989) enthält (u.a.) für das Jahr 

1974 die Altersverteilung aller Personen, die in diesem Jahr 

in der BRD gemeldet waren, sowie die Möglichkeit, das 

Ziehen einer Stichprobe zu simulieren und deren Verteilung 

mit der tatsächlichen (über Histogramme und Mittelwerte) 

zu vergleichen. 

4

Statistische Grundbegriffe 

Die Grundgesamtheit (Population) ist die Gesamtmenge 

von Merkmalsträgern (Objekten) über die Aussagen 

gemacht werden sollen. 

Beispiele: Gesamtbevölkerung in Deutschland, 

Wahlberechtigte in Deutschland, WählerInnen einer Partei, 

StudentInnen einer Fachrichtung 

Es interessieren gewisse Merkmale, die die Merkmalsträger 

aufweisen. 

Beispiele: Geschlecht, Höhe des Einkommens, Zufriedenheit 

mit der Statistikausbildung 

5

Kann die Grundgesamtheit nicht vollständig – durch 

Einbeziehung aller Merkmalsträger (Totalerhebung) – 

hinsichtlich der interessierenden Merkmale untersucht 

werden, so versucht man eine möglichst repräsentative 

Teilerhebung zu verwenden. 

Liegen keine gesicherten Kenntnisse über die Struktur der 

Grundgesamtheit hinsichtlich der interessierenden Merkmale 

vor, so sichert nur das Zufallsprinzip repräsentative 

Teilerhebungen. Die einbezogenen n Merkmalsträger werden 

rein zufällig und unabhängig voneinander ausgewählt 

(gezogen). Dabei hat jeder Merkmalsträger bei jeder Ziehung 

die gleiche Chance ausgewählt zu werden (”rein zufälliges” 

Ziehen mit Zurücklegen). Die Ziehungsergebnisse beinflussen 

sich dabei auch nicht gegenseitig (Unabhängigkeit). 

6

Betrachtet man für ein interessierendes Merkmal die 

Zufallsvariable X, die die Merkmalsausprägungen – kodiert 

durch Zahlen – bei einer rein zufälligen Auswahl eines 

Merkmalsträgers aus der Grundgesamtheit beschreibt, so 

besitzt sie die im allg. unbekannte Verteilungsfunktion FX 

der Merkmalsausprägungen dieses Merkmals in der 

Grundgesamtheit (entsprechende Verteilung eines ” zufälligen 

Bürgers“). 

7

Das stochastische Modell für das Ziehen einer reinen 

Zufallsstichprobe ist die mathematische Stichpobe 

[random sample] 

vom Stichprobenumfang n. 

(X1, X2, ..., Xn) 

Xi beschreibt dabei die zufällige Merkmalsausprägung des 

i–ten ausgewählten Merkmalträgers. Der Zufall steckt dabei 

in der Auswahl des Merkmalsträgers! Nach der 

Ziehungsvorschrift besitzen alle Xi die gleiche Verteilung FX 

des interessierenden Merkmals X in der Grundgesamtheit. 

Diese Modellvorstellung wird dann zur Berechnung 

der Unsicherheiten beim Schluss von der Stichprobe 

auf die Grundgesamtheit verwendet. 

8

Das Resultat einer Datenerhebung ist die konkrete 

Stichprobe (x1, x2, ..., xn). xi steht dabei für die registrierte 

Merkmalsausprägung des i–ten ausgewählten 

Merkmalträgers. Gemäß der Modellvorstellung sind die Daten 

eine Realisierung einer mathematischen Stichprobe. 

Beschreibt man also den Ziehungs-Prozess einer 

mathematischen Stichprobe, so verwendet man 

Zufallsvariablen (z.B. Xi), und beschreibt man die 

Realisierung (das Resultat) einer konkreten Ziehung, so 

verwendet man reelle Zahlen (z.B. xi). 

Übliche Sprechweise für diese Modellannahmen: ” Die 

Stichprobe (x1, . . . , xn) entstamme einer nach FX verteilten 

Grundgesamtheit.“ 

9

Praktisch hat man es stets mit der konkreten Stichprobe 

(x1, . . . , xn) zu tun, mit deren Hilfe man Informationen über 

die Population gewinnen will. Die mathematische Stichprobe 

dient zur wahrscheinlichkeitstheoretischen Begründung der 

Schlussweisen und zur Quantifizierung von Unsicherheiten. 

Werden mehrere Merkmale registriert oder besteht das 

Anliegen im Vergleich verschiedener Merkmale oder 

verschiedener Populationen, werden bei der Modellbildung 

verschiedene Zufallsvariablen (z.B. X, Y, . . .) eingeführt und 

multivariat (z.B. bivariat (X, Y )) gemeinsam betrachtet. 

10

Stichprobenfunktion 

Sei g : R n → R eine Funktion. 

(X1, X2, . . . , Xn) ↦→ T = g(X1, X2, . . . , Xn) 

math. Stichprobe Stichprobenfunktion 

Zufallsvariablen Zufallsvariable 

(x1, x2, . . . , xn) ↦→ t = g(x1, x2, . . . , xn) 

konkrete Stichprobe Stichprobenfunktion 

reelle Zahlen (n-Tupel) reelle Zahl 

Stichprobenfunktionen werden für den Schluss von der 

Stichprobe auf die Grundgesamtheit verwendet. 

11

Bemerkungen: 

– T und t sind allgemein übliche Bezeichnungen, für 

spezielle Stichprobenfunktionen sind aber auch andere 

Bezeichnungen üblich; zum Beispiel 

¯X = 1 

n 

n 

i=1 

Xi und ¯x = 1 

n 

n 

i=1 

– Stichprobenfunktionen begegnen uns also als Formeln: 

Setzen wir die Werte der konkreten Stichprobe ein, kommt 

eine Zahl t heraus. Setzen wir die Zufallsvariablen der 

mathematischen Stichprobe ein, kommt eine 

Zufallsvariable T heraus. 

– t kann als Realisierung der Zufallsvariablen T verstanden 

werden. 

12 

xi

Schätzungen 

Wir betrachten dazu zwei Beispiele. 

Beispiel (Körpergrößen): Schätzen der 

Durchschnittsgröße µ der Kinder in der Grundgesamtheit. 

– Gegeben: Konkrete Stichprobe (x1, . . . , xn) 

– Plausibel (Warum eigentlich?): 

¯x = 1 

n 

n 

i=1 

als Schätzung für den Durchschnitt µ in der 

Grundgesamtheit 

– Frage: Wie gut ist diese Schätzung? – 

Antwort mit Hilfe eines stochastischen Modells. 

13 

xi

– Die Zufallsvariable X beschreibe die Körpergröße eines 

rein zufällig aus der Grundgesamtheit ausgewählten 

Kindes. Sie besitzt die unbekannte Verteilung FX mit 

Erwartungswert µ (unbekannter Durchschnittswert). 

– Sei (X1, . . . , Xn) eine mathematische Stichprobe vom 

Umfang n. Dabei seien alle Xi wie X verteilt. 

– Dann ist 

¯X = 1 

n 

n 

i=1 

eine Punktschätzung [point estimation] für µ, ihre 

Realisierung 

¯x = 1 

n 

n 

i=1 

Xi 

xi 

ist eine konkrete Punktschätzung. 

14

– Nach dem Zentrale Grenzwertsatz ist ¯ X für große n 

näherungsweise normalverteilt. Damit ist eine weiter 

gehende Untersuchung der Genauigkeit der Schätzung 

möglich. Beispielsweise kann die Wahrscheinlichkeit von 

Abweichungen der Schätzung vom zu schätzenden 

Durchschnittswert berechnet werden. 

– Es gilt 

E( ¯ X) = E 

1 

n 

n 

i=1 

Xi 

 

= 1 

n 

n 

i=1 

E(Xi) = 1 

n 

n 

µ = µ 

i=1 

Daher wird der Schätzer ¯ X für den (unbekannten) 

Erwartungswert µ erwartungstreu genannt. 

15

Allgemein gilt: Sei γ der interessierende - zu schätzende - 

Parameter. Für eine Stichprobenfunktion g : R n → R heißt 

die reelle Zahl 

t = g(x1, . . . , xn) 

konkrete Punktschätzung und die Zufallsvariable 

T = g(X1, . . . , Xn) 

Punktschätzung für den Parameter γ. 

Sowohl T als auch t werden oftmals mit ˆγ bezeichnet. 

Die Punktschätzung heißt erwartungstreu, wenn E(T ) = γ 

gilt. 

Weitere Punktschätzungen, ihre Eigenschaften und Methoden 

zu ihrer Konstruktion −→ Literatur. 

16

Ein aus einer konkreten Stichprobe berechneter Mittelwert ¯x 

trifft den zu schätzenden Durchschnittswert µ in der 

Grundgesamtheit nur sehr selten oder fast nie genau (im allg. 

ist also ¯x = µ). 

Ausweg: Man betrachtet neben Punktschätzungen auch 

Intervallschätzungen (Konfidenzschätzungen, 

Konfidenzintervalle [confidence interval]). 

Dabei verwendet man das folgende Konstruktionsprinzip: 

Auf der Basis einer mathematischen Stichprobe ist ein 

zufälliges Intervall anzugeben, dass den zu schätzenden 

Parameter – hier den Durchschnittswert µ – mit einer 

vorgegeben Wahrscheinlichkeit, dem Konfidenzniveau 

[level of confidence] (1 − α), enthält (überdeckt). 

17

Ist die Verteilung der verwendeten Stichprobenfunktion – hier 

des arithmetischen Mittels – bekannt, so lassen sich aus dieser 

Forderung die Grenzen eines Konfidenzintervalles berechnen. 

Aus der t–Verteilung der (standardisierten) Zufallsvariable 

¯X − µ √ 

n 

S 

erhalten wir in unserem Beispiel zum Konfidenzniveau 1 − α 

(α ist also die Wahrscheinlichkeit für die Nichtüberdeckung) 

folgende Vorschrift zur Berechnung eines konkreten 

Konfidenzintervalles für den unbekannten Durchschnittswert 

µ der Körpergröße in der Grundgesamtheit: 

 

¯x − t n−1,1− α 

2 

· s 

√ n , ¯x + t n−1,1− α 

2 

18 

· s 

√ n

In der Formel 

 

¯x − t n−1,1− α 

2 

bezeichnet t n−1,1− α 

2 

· s 

√ n , ¯x + t n−1,1− α 

2 

· s 

√ n 

das Quantil der t–Verteilung mit n − 1 

Freiheitsgraden und Quantilsanteil (1 − α/2). Für ein 

Konfidenzniveau von 95% und einen Stichprobenumfang 

n = 200 ergibt sich t199,0.975 = 1.96. Mit ¯x = 143.7 und 

s = 7.223 erhalten wir als konkretes Konfidenzintervall 

 

143.7 − 1.96 · 7.223 

√ , 143.7 + 1.96 · 

200 7.223 

 

√ = [142.7, 144.7] 

200 

19

Für die Interpretation von Konfidenzintervallen gilt: 

Ein konkretes Konfidenzintervall enthält den zu schätzenden 

Parameter, oder es enthält ihn nicht. Die Konstruktion des 

Konfidenzintervalles sichert aber, dass bei häufiger 

Wiederholung des Ziehungsvorganges für die Stichprobe die 

berechneten Konfidenzintervalle den zu schätzenden 

Parameter in ca. (1 − α)% der Fälle enthalten. 

20

Beispiel (Verkehrsmittel): 

Schätzen des Anteils ϑ der PKW–BenutzerInnen in der 

Grundgesamtheit. 

– Gegeben: Konkrete Stichprobe (x1, . . . , xn) 

– Plausibel (Warum eigentlich?): Die relative Häufigkeit für 

das interessierende Ereignis (hier PKW-Nutzung) 

f = h 

n 

als Schätzung für den Anteil (die Wahrscheinlichkeit) ϑ in 

der Grundgesamtheit 

– Frage: Wie gut ist diese Schätzung? – 

Antwort mit Hilfe eines stochastischen Modells. 

21

– Die Zufallsvariable X habe den Wert 1, falls von einer 

zufällig ausgewählten Person aus der Grundgesamtheit 

PKW genutzt wird und ist sonst 0. Ihre Verteilung ist 

P (X = 1) = ϑ und P (X = 0) = 1 − ϑ 

mit der unbekannten Wahrscheinlichkeit (Parameter) ϑ. 

– Sei (X1, . . . , Xn) eine mathematische Stichprobe vom 

Umfang n. Dabei seien also alle Xi wie X verteilt. 

– Dann ist 

1 

n 

n 

i=1 

eine Punktschätzung für ϑ und h/n = ( n i=1 xi)/n eine 

konkrete Punktschätzung. 

22 

Xi

– Für eine mathematische Stichprobe ist die Zufallsvariable 

H = n i=1 Xi binomialverteilt und nach dem Zentralen 

Grenzwertsatz für große n näherungsweise normalverteilt. 

Damit ist eine weiter gehende Untersuchung der 

Genauigkeit der Schätzung möglich. Beispielsweise kann 

die Wahrscheinlichkeit von Abweichungen der Schätzung 

vom zu schätzenden Anteilswertwert berechnet werden. 

– Ein aus einer konkreten Stichprobe berechneter 

Anteilswert h/n trifft den zu schätzenden Anteilswert ϑ in 

der Grundgesamtheit nur sehr selten oder fast nie genau 

(im allg. ist also h/n = ϑ). 

– Ausweg: Intervallschätzungen 

23

– Auf der Basis einer mathematischen Stichprobe ist ein 

zufälliges Intervall anzugeben, dass den zu schätzenden 

Parameter – hier den Anteilswert ϑ – mit einer vorgegeben 

Wahrscheinlichkeit, dem Konfidenzniveau (1 − α), 

enthält (überdeckt). 

Ist die Verteilung der verwendeten Stichprobenfunktion – 

hier der absoluten Häufigkeit – bekannt, so lassen sich die 

Grenzen von Konfidenzintervallen berechnen. 

24

Für größere Stichproben (n > 30) erhält man für ein 

Konfidenzniveau 1 − α unter Verwendung der 

Normalverteilung folgende Vorschrift zur Berechnung eines 

konkreten Konfidenzintervalles für den unbekannten 

Anteilswert ϑ der PKW–Benutzer in der Grundgesamtheit: 

⎡ 

⎣ h 

n − z1− α 

2 · 

 

h h 

n (1 − n ) 

, 

n 

h 

n + z1− α 

2 · 

 

h h 

n (1 − n ) 

⎤ 

⎦ 

n 

Dabei bezeichnet z 1− α 

2 

das Quantil der standardisierten 

Normalverteilung mit Quantilsanteil 1 − α/2. 

25

Für ein Konfidenzniveau von 95% ergibt sich z0.975 = 1.96. 

Für den Stichprobenumfang n = 100 und 

h/n = 53/100 = 0.53 erhalten wir das konkrete 

Konfidenzintervall 

⎡ 

 

⎣0.53 

0.53(1 − 0.53) 

− 1.96 · 

, 0.53 + 1.96 · 

100 

= [43.2%, 62.8%] 

26 

 

0.53(1 − 0.53) 

100 

⎤ 

⎦

Schließende Statistik - Fachrichtung Mathematik

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?