Teil 1

Vorlesungsskript 

Statistik 

Grundstudium 

Modul G1-3.2 Statistik I 

Teil 1 

Fachhochschule 

der 

Deutschen Bundesbank 

Dr. Dietmar Hubrich

Dr. Dietmar Hubrich Statistik I Seite 2 

Fachhochschule der Modulteil G1-3.2 

Deutschen Bundesbank Teil 1 

G1-3.2 Statistik I (Teil 1) 

1 Aufgaben und Ziele der Statistik 

2 Träger der Statistik und Grundbegriffe 

2.1 Amtliche und nichtamtliche Statistik 

2.2 Statistische Einheiten und statistische Massen 

2.3 Merkmale, Merkmalsträger und Metrik 

3 Formen und Arten der Datenerhebung 

4 Aufbereitung des Datenmaterials 

4.1 Reihen und Häufigkeiten 

4.2 Empirische und theoretische Verteilungen 

4.3 Grafische Darstellungen 

5 Mittelwerte und Streuungsmaße 

5.1 Lageparameter 

5.1.1 Modalwert (dichtester Wert) 

5.1.2 Median (Zentralwert) 

5.1.3 Arithmetisches Mittel 

5.1.4 Geometrisches Mittel 

5.2 Streuungsparameter 

5.2.1 Spannweite (Streubreite) 

5.2.2 Quartilsabweichung 

5.2.3 Varianz, Standardabweichung und Variationskoeffizient 

Literatur: Fahrmeier, L.; Künstler, R.; Pigeot, I.; Tutz, G. „Statistik“ – Der Weg zur 

Datenanalyse –, Springer Verlag 7. Aufl. 

Schulze, P.- M. „Beschreibende Statistik“, Oldenbourg Verlag,“ 

Bourier, G. „Beschreibende Statistik - Praxisorientierte Einführung 

mit Aufgaben und Lösungen -“, Gabler Verlag 5. Aufl. 

sowie jedes andere Lehrbuch der Statistik




Methoden der Wissensermittlung 

Naturwissenschaft 

Beobachtung der Umwelt 

Erklärungsversuch des Phänomens 

durch „Hypothese“ 

Experiment falsifiziert 

verifiziert 

„Theorie“ 

(bleibt bestehen bis Gegenbeispiel 

gefunden wird) 

wenn lange Zeit nicht falsifiziert 

„Gesetz“ 

Konsequenzen für die Statistik : 

Sozialwissenschaft 

Beobachtung der Umwelt 

Erklärungsversuch des Phänomens 

durch „Hypothese“ 

Test der „Hypothese“ fast 

ausschließlich an Modellen. 

Experiment eher die Ausnahme 

verifiziert ? falsifiziert 

wegen Zeitvarianz und Raumvarianz 

der Hypothesen hat die Theorie nur 

begrenzte Gültigkeit. 

Wenn lange Zeit nicht falsifiziert 

„Quasi-Gesetz“ 

♦ Prozess der Falsifizierung erfolgt viel öfter in den Sozialwissenschaften als in 

den Naturwissenschaften. 

♦ Ständiger Bedarf an neuen Hypothesen, die getestet werden müssen. 

♦ Sehr hoher Informationsbedarf. 

♦ Datenangebot immer wesentlich kleiner als Datennachfrage. 

Wenn : Datenangebot




Arbeitsweise des Statistischen Bundesamtes 

Gemäß §2 des Gesetzes über die Statistik für Bundeszwecke besteht 

die Aufgabe des Statistischen Bundesamtes in: 

⇒ Statistiken für Bundeszwecke technisch und methodisch 

vorzubereiten 

⇒ Die Ergebnisse für den Bund zu sammeln, zu erheben und 

aufzubereiten 

⇒ Volkswirtschaftliche Gesamtrechnungen aufzustellen 

⇒ Statistiken des Auslands zu sammeln und darzustellen 

Zu diesem Zweck veröffentlicht das Amt: 

⇒ Statistisches Jahrbuch für die Bundesrepublik Deutschland 

⇒ Monatszeitschrift „Wirtschaft und Statistik“ 

⇒ Fachserien 

Die Aufgaben der Statistischen Landesämter umfassen: 

⇒ Erhebungen bei den einzelnen Merkmalsträgern 

⇒ Kumulierung der Ergebnisse zu Landesergebnissen 

⇒ Bereitstellung des Landesergebnisses zur Ermittlung des 

Bundesergebnisses. 

⇒ Vereinheitlichung aller Abgrenzungen hinsichtlich des 

Berichtskreises und der erhobenen Merkmale




Statistische Einheit und Statistische Masse 

Begriff : Statistische Einheit 

Die statistische Einheit ist das Einzelobjekt der statistischen 

Untersuchung. Sie ist der Träger der bei der Untersuchung 

interessierenden Information. 

Jede statistische Einheit muss 

Identifikationskriterien 

der statistischen 

♦ sachlich 

♦ räumlich 

Einheit 

♦ zeitlich eindeutig identifizierbar bzw. 

abgrenzbar sein. 

Begriff : Statistische Masse 

Die statistische Masse ist die Gesamtheit (Menge) von 

statistischen Einheiten mit übereinstimmenden 

Identifikationsmerkmalen. 

Alle Einheiten einer statistischen Masse sind sachlich, räumlich 

und zeitlich gleich abgegrenzt. 

Begriff : Strukturbruch 

Verändern sich die Identifikationsmerkmale der statistischen 

Einheiten einer statistischen Masse, so bezeichnet man dieses 

Phänomen als Strukturbruch. 

Beispiel : Volkszählung in der Bundesrepublik Deutschland: 

sachlich : jede lebende menschliche Person 

räumlich : Angabe des Gebietes, hier BRD 

zeitlich : Angabe eines Stichtages, z.B. 1.5.2011




Begriff : Bestandsmasse 

Bestands- und Ereignismassen 

Bestandsmassen sind statistische Massen, deren Einheiten eine 

gewisse Lebensdauer in der Zeit aufweisen. Die Erfassung von 

Bestandsmassen kann und muss deswegen stichtagsbezogen 

erfolgen. 

Beispiel : Weinvorrat im Keller 

1.1.2011 → 12 Flaschen 

1.2.2011 → 8 Flaschen 

1.3.2011 → 10 Flaschen 

Problem : Stichtagsunabhängigkeit 

durchschnittlicher 

Bestand für das 

I. Quartal → 

12 + 8 + 10 

= 10 Flaschen 

3 

Um Bestände auch stichtagsunabhängig angeben zu können, 

ist es sinnvoll, eine Bestandsmasse über einen Zeitraum hinweg 

durch ihren Durchschnittsbestand zu definieren. 

Begriff : Ereignismasse 

Ereignismassen sind statistische Massen, deren Einheiten zu 

ganz bestimmten Zeitpunkten auftreten, die im Zeitablauf zum 

Gesamtergebnis kumulieren. Die Erfassung von Ereignismassen 

kann und muss deswegen zeitraumbezogen erfolgen. 

Beispiel : Demoskopische Daten 

Geburten im Laufe des Jahres alle Einzelergebnisse 

Todesfälle im Laufe des Jahres des Jahres werden 

Zuwanderung im Laufe des Jahres kumuliert.




Begriff : Merkmal 

Merkmale und Merkmalsträger I 

Die Eigenschaften einer statistischen Einheit, die für die 

statistische Untersuchung relevant sind, heißen statistische 

Merkmale. 

Begriff : Merkmalsträger 

Träger der Merkmale, als Besitzer bestimmter interessierender 

Eigenschaften, sind immer die statistischen Einheiten selbst. 

Begriff : Merkmalsausprägung 

Alle möglichen Zustände, die ein Merkmal annehmen kann, 

heißen Merkmalsausprägungen. Sie können vorkommen als: 

abzählbare oder diskrete ↔ nicht-abzählbare oder stetige 

Merkmalsausprägungen. 

Beispiele : 

Noten in einer Klausur. 

Geschlecht einer Person. 

Begriff : Merkmalswerte 

Körpergewicht von Personen. 

Einkommen von Familien. 

Derjenige Wert, den ein Merkmal von allen möglichen 

Merkmalsausprägungen tatsächlich annimmt, heißt 

Merkmalswert. 

Er ist das eigentliche Datum, der Träger der Information, der in 

einer statistischen Analyse verarbeitet wird. 

Beispiel : 

Merkmalsausprägung → Noten ; Merkmalswert → sehr gut




Merkmale und Merkmalsträger II 

Merkmalswerten, Merkmalsausprägungen oder Merkmalen 

können zwei großen Klassifizierungen zugeordnet werden: 

Begriff : Quantitative Merkmale 

Quantitative Merkmale sind Merkmale, denen Zahlen 

zugeordnet werden können und die durch diese Zahlen 

vollständig beschreibbar sind. 

Dies bedeutet insbesondere: 

♦ Quantitative Merkmale besitzen stets eine Dimension. 

♦ Es können Abstände angegeben werden. 

♦ Die Messvorschrift ist stets eine kardinale Messmetrik. 

♦ Schlüsselzahlen sind keine quantitativen Merkmale. 

Begriff : Qualitative Merkmale 

Qualitative Merkmale sind Merkmale, die nicht durch 

dimensionsbehaftete Zahlen beschreibbar sind. Voneinander 

unterscheidbar werden sie nur durch ihre Beschaffenheit oder 

Bedeutung. 

Dies bedeutet insbesondere: 

♦ Schlüsselzahlen sind qualitative Merkmale. 

♦ Es können keine Differenzen berechnet werden. 

♦ Qualitative Merkmale sind dimensionslos. 

♦ Die Messvorschrift ist eine nominale oder ordinale 

Messmetrik. 

Problem : 

Sind qualitative oder quantitative Merkmalsausprägungen stetig, 

so ist es nicht möglich einen exakten Merkmalswert zu erheben. 

In einem solchen Fall, wird man versuchen die Abzählbarkeit durch 

Bildung von Klassen zu ermöglichen. 

→ Klassierung von Daten




Begriff : nominale Metrik 

Messniveaus von Merkmalen I 

Die nominale Metrik ist eine Messvorschrift für Merkmalsausprägungen. 

Sie beschränkt sich auf die Untersuchung der 

Gleichheit oder Ungleichheit mit einem vorgegebenen oder 

erwarteten Erhebungsmerkmal. 

Dabei gilt insbesondere: 

♦ Nominale Metrik ist auch anwendbar auf qualitative 

Merkmale. 

♦ Nominale Metrik beruht auf dem Prinzip der vergleichenden 

Zuordnung. 

♦ Die Reihenfolge der Merkmalswerte ist beliebig. Es erfolgt 

keine Wertung. 

Begriff : ordinale Metrik 

Die ordinale Metrik ist eine Messvorschrift für bewertbare 

Merkmalsausprägungen. Auch hier steht die Gleichheit oder 

Ungleichheit mit einem vorgegebenen oder erwarteten Erhebungsmerkmal 

im Vordergrund. 


♦ Ordinale Metrik ist auch anwendbar auf qualitative 

Merkmale. 

♦ Ordinale Metrik beruht ebenfalls auf dem Prinzip der 

vergleichenden Zuordnung. 

♦ Die Reihenfolge der Merkmalswerte ist nicht beliebig. Es 

erfolgt immer eine Einstufung in eine Rangskala.




Begriff : kardinale Metrik 

Messniveaus von Merkmalen II 

Die kardinale Metrik ist eine Messvorschrift für zahlenmäßig 

erklärbare Merkmalsausprägungen. 


♦ Anwendung nur auf quantitative Merkmale. 

♦ Es können Abstände und Relationen gemessen werden. 

♦ Es können nur Merkmale erfasst werden, die eine Dimension 

besitzen. 

Vergleich der Messvorschriften: 

Messvorschrift Erfassbare Merkmale 

nominale Metrik qualitative und 

quantitative Daten 

ordinale Metrik ordenbar qualitative 

und quantitative 

Daten 

kardinale Metrik nur quantitative 

Daten 

Fazit des Vergleichs : 

Anforderung an das 

Datenmaterial 

schwächste Anforderung 

an die Messbarkeit eines 

Merkmals. 

mittlere Anforderung an 

die Messbarkeit eines 

Merkmals. 

höchste Anforderung an 

die Messbarkeit eines 

Merkmals. 

Die strengste Metrik, also die kardinale Metrik, beinhaltet die 

schwächste Metrik, also die nominale Metrik. Alles, was mit 

einer kardinalen Metrik gemessen werden kann, kann auch 

mit einer ordinalen oder nominalen Metrik gemessen werden.




Begriffe : 

Urliste 

Ungeordnete 

Statistische 

Reihe 

Ordnungskriterien 

der 

geordneten 

statistischen 

Reihe 

Besetzungszahl 

Absolute 

Häufigkeit der 

Klasse i 

Bei k-Klassen 

gilt: 

Relative 

Häufigkeit der 

Klasse i 

Bei k-Klassen 

gilt: 

Reihen, Häufigkeiten und Verteilungen I 

Sammlung von Merkmalswerten einer Erhebung 

X : x1 , x2 , x3 ,..., xn 

n = Gesamtzahl der einbezogenen statistischen 

Einheiten. 

ordinal/kardinal → Größe der Zahl oder Rang 

nominal → sachliche Ordnung 

Zeitpunkt der 

Erhebung → Zeitreihen, Indexreihen, etc.. 

Anzahl der Merkmalsträger pro Klasse 

Besetzungszahl der i.ten Klasse = hi 

k 

= ∑ 

i= 

1 

n h i 

n = Gesamtzahl der einbezogenen statistischen 

Einheiten. 

hi 

fi 

= 

n 

fi = relative Häufigkeit der Klasse i 

k 

∑ fi = 

i= 

1 

1 oder 100 %




Begriffe: 

HäufigkeitstabelleHäufigkeitsverteilung 

Reihen, Häufigkeiten und Verteilungen II 

Tabellarische Darstellung der absoluten Häufigkeiten. 

Zusammenstellung der Merkmalswerte in Klassen mit 

zugehörigen absoluten/relativen Häufigkeiten. 

Beispiel : Soziale Stellung des Haushaltsvorstands (BRD, 1969) 

Klasse i 

Soziale 

Stellung 

xi 

Absolute 

Häufigkeit hi 

[in 100.000] 

Relative 

Häufigkeit fi 

Verteilungsfunktion 

F(xi) 

1 Landwirt 8 0,04 0,04 

2 Selbständig 16 0,07 0,11 

3 Beamter 12 0,06 0,17 

4 Angestellter 36 0,17 0,34 

5 Arbeiter 63 0,31 0,66 

6 Nicht Erwerbstätige 

71 

0,34 

1,00 

Σ: 206 1,00 ./. 

Begriff : Verteilungsfunktion 

Die Verteilungsfunktion F(x) für das Merkmal x ist die Funktion, 

die jedem Merkmalswert xi den Anteilswert aller statistischen 

Einheiten zuordnet, die einen Merkmalswert xi oder kleiner 

i h i 

j 

aufweisen: F( xi)= 

∑ = ∑fj 

j = 1,2,3,...,k 

j= 

1 n j= 

1 

(k ist die Anzahl der Klassen oder Häufungspunkte)




Empirische und theoretische Verteilungen 

Begriff : empirische Verteilungsfunktion 

Unter einer empirischen Verteilungsfunktion versteht man die 

Kumulierung der relativen Häufigkeiten von klassierten, real 

erhobenen Merkmalswerten. 

Beispiel : Schlagball - Weitwürfe von Schülern 

Klasse i Weite x in m Häufigkeit h i 

relative 

Häufigkeit f i 

Besetzungsdichte 

f i/d i 

Verteilungsfunktion 

F(x i) 

1 15




Beispielfragestellungen zu charakteristischen Kennziffern 

Beispiel I: 

In der Schlossbank betrugen die monatlichen Gehälter der männlichen und 

weiblichen Angestellten (in EUR): 

Männliche Arbeitnehmer : 

1650 , 2030 , 4800 , 3200 , 3700 , 4100 , 3200 , 2030 , 3200 , 4100 , 3200 

Weibliche Arbeitnehmer : 

1710 , 1960 , 2500 , 1480 , 1710 , 2300 , 3200 

Beispiel II: 

Im Konzern A betrugen die Einkommen der männlichen und weiblichen 

Arbeitnehmer (in EUR): 


Einkommen Arbeitnehmer 

X 

hi 

0 - u. 4800 824 

4800 - u. 9600 549 

9600 - u. 16000 2839 

16000 - u. 25000 3908 

25000 - u. 50000 1370 

50000 - 100000 100 

Gesamt 9590 


Einkommen Arbeitnehmer 

X 

hi 

0 - u. 2400 426 

2400 - u. 4800 358 

4800 - u. 7200 517 

7200 - u. 12000 1219 

12000 - u. 25000 1327 

25000 - 100000 116 

Gesamt 3963 

Diese Beispiele dienen als 

Übungsstandard. Gemäß 

den vorkommenden 

Merkmalsarten 

klassiert, quantitativ bzw. 

diskret, quantitativ 

sind unterschiedliche 

Berechnungsmethoden zur 

Bestimmung der Lage- und 

Streuungsparameter 

anzuwenden.




Vollständige Häufigkeitstabelle zum Beispiel II 


Einkommen X [EUR] hi fi fi/di*10 6 Fi 

0 - u. 4800 824 0,086 17,9 0,086 

4800 - u. 9600 549 0,057 11,9 0,143 

9600 - u. 16000 2839 0,296 46,3 0,439 

16000 - u. 25000 3908 0,408 45,3 0,847 

25000 - u. 50000 1370 0,143 5,7 0,990 

50000 - 100000 100 0,010 0,2 1,000 


Σ 9590 1,000 ./. ./. 


0 - u. 2400 426 0,107 44,8 0,107 

2400 - u. 4800 358 0,090 37,6 0,197 

4800 - u. 7200 517 0,130 54,4 0,327 

7200 - u. 12000 1219 0,308 64,1 0,635 

12000 - u. 25000 1327 0,335 25,8 0,971 

25000 - 100000 116 0,029 0,4 1,000 

Σ 3963 1,000 ./. ./.




Besetzungsdichte fi/di *10^6 

Besetzungsdichte fi/di *10^6 

50 

40 

30 

20 

10 

Histogramme zum Beispiel II 

Histogramm : Männliche Arbeitnehmer (Beispiel 2) 

0 

0 20000 40000 60000 80000 100000 120000 

Einkommen in EUR 

70 

60 

50 

40 

30 

20 

10 

Histogramm : Weibliche Arbeitnehmer (Beispiel 2) 

0 

0 20000 40000 60000 80000 100000 120000 


Die Histogramme lassen die Vermutung zu, dass die männlichen 

Arbeitnehmer des Konzerns A prinzipiell mehr verdienen als ihre 

Kolleginnen. 

Eine exakte Bestätigung dieser Vermutung lässt die Anschauung 

nicht zu. Hierfür ist es notwendig, Lage- bzw. Streuungsparameter 

zu berechnen.




Modalwert (Modus, häufigster Wert) 

Als Modalwert der Verteilung eines Merkmals bezeichnet man den 

Merkmalswert, der am häufigsten auftritt. 

(1) Bei qualitativen Merkmalen und bei diskreten quantitativen 

Merkmalen: 

Der Merkmalswert, für den die relative oder absolute 

Häufigkeit f i ihr Maximum erreicht, bezeichnet den 

Modalwert X D. 

(2) Bei stetigen quantitativen Merkmalen werden Klassen gebildet. 

Für klassierte Merkmale gilt: 

Die Klasse mit der größten Besetzungsdichte 

(Häufigkeitsdichte) heißt modale Klasse. Die 

Klassenmitte der modalen Klasse bezeichnet den 

Modalwert X D. 

♦ Der Modalwert hat nur dann einen Sinn, wenn die Verteilung 

eingipflig ist, also ein eindeutiges, globales Maximum besitzt. 

♦ Auch bei nominalskalierten Merkmalen ist der Modalwert ein 

sinnvoller Mittelwert. 

♦ Die Berechnung eines Modalwertes einer zusammengefassten 

Grundgesamtheit aus den Modalwerten der Teilgesamtheiten 

ist nicht möglich.




Beispiel I : 

Lösungen zur Berechnung des Modalwertes 

männlich : xD = 3200 EUR 

weiblich : xD = 1710 EUR 

männ. + weib. : xD = 3200 EUR 

Beispiel II : 

männlich : Modale Klasse : 

9600 - unter 16000 

weiblich : Modale Klasse : 

7200 - unter 12000 

männ. + weib. : Modale Klasse : 

9600 - unter 16000 

xD = 12800 EUR 

xD = 9600 EUR 

xD = 12800 EUR 

Zur Berechnung des Modalwertes Beispiel II (männ. + weib.) ist es 

notwendig eine neue gemeinsame Häufigkeitstabelle zu erstellen. 

Bei unterschiedlichen Klassenbreiten verwendet man dazu die 

Methode der Zuschlagsrechnung (Rechenschema s. nächste 

Seite). Die Intervallstruktur wird dabei von der Teilgesamtheit mit 

der größeren Anzahl an Merkmalsträgern übernommen. 

Die vollständige Häufigkeitstabelle hat dann folgendes Aussehen: 

Männliche + Weibliche Arbeitnehmer (Beispiel II) : 


0 - u. 4800 1608 0,119 24,7 0,119 

4800 - u. 9600 1675 0,124 25,7 0,243 

9600 - u. 16000 3857 0,285 44,4 0,528 

16000 - u. 25000 4827 0,356 39,6 0,884 

25000 - u. 50000 1409 0,104 4,1 0,988 

50000 - 100000 177 0,013 0,3 1,000 

Σ 13553 1,000 ./. ./.




Rechenschema zur Häufigkeitstabelle Beispiel II 

Die Teilgesamtheit der männlichen Arbeitnehmer besitzt die größte 

Anzahl an Merkmalsträgern. Diese Intervallstruktur ist Grundlage für 

die zusammengefasste Häufigkeitstabelle: 

Klasse 

1 

2 

3 

4 

5 

6 

Intervall 

0 - u. 4800 

4800 - u. 9600 

9600 - u. 16000 

16000 - u. 25000 

25000 - u. 50000 

50000 - 100000 

Σ 

Häufigkeit 

824 + 426 + 358 = 1608 

1219 

549 + 517 + 

2 

= 1675 

609,5 wird auf 609 gerundet. (Rest 610) 

Zuschlag untere Klasse. 

16000 − 12000 

2839 + 610 + 

⋅ 1327 

13000 

= 3857 

→ + 408 (Rest 919) 

3908 + 919 = 4827 

1370 

+ 

50000 − 25000 

⋅ 116 

75000 

= 1409 

→ + 39 (Rest 77) 

100 + 77 = 177 

13553




I. Diskreter Fall 

Median (Zentralwert) I 

Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden 

nach ihrer Größe geordnet. 

Dabei bedeutet: 

x 

1 

x 

i 

x 

n 

→ 

→ 

→ 

der kleinste Merkmalswert 

der i.te Merkmalswert der geordneten Reihe 

der größte Merkmalswert 

Als Median der Verteilung eines Merkmals bezeichnet man den 

mittleren Merkmalswert der Reihe. D.h. : 

Oberhalb und unterhalb des Medians liegen gleichviele 

Merkmalswerte. 

Es gilt für den Median XZ : 

X = X 

Z n+ 

1 

2 

X : x , x , x , ... ,x 

1 2 3 n 

1 ⎛ ⎞ 

X Z = ⋅ ⎜ xn + xn 

⎟ falls n geradzahlig ist. 

2 ⎝ 

+ ⎠ 

2 2 1 

falls n ungerade bzw.




II. Klassierter Fall 

Median (Zentralwert) II 

Bei klassierten Merkmalen wird der Median approximativ mit Hilfe 

der Verteilungsfunktion Fi bestimmt. 

Der Merkmalswert, bei dem die Verteilungsfunktion den 

Wert 0,5 annimmt, bezeichnet den Median 

X Z → (F(X Z) = 0,5). oder 

Der Median bezeichnet den Wert, bei dem die Fläche des 

Histogramms genau halbiert wird. 

III. Merkregeln zum Median : 

♦ Die Berechnung des Medians setzt voraus, dass die Merkmalswerte 

ordenbar sind. Er kann deshalb auch für Rangmerkmale, 

jedoch nicht für nominalskalierte Merkmale berechnet 

werden. 

♦ Extremwerte haben keinen Einfluss auf die Höhe des Medians. 

Der Wert XZ ist nur abhängig von der Größe des in der Mitte der 

Reihe liegenden Merkmalswertes. 

♦ Die Summe der absoluten Abweichungen der Merkmalswerte 

vom Median ist minimal. 

n 

∑ 

i= 

1 

x − x = 

i Z 

min ! 

D.h. Die Summe der absoluten Abweichungen von jedem 

anderen Merkmalswert ist größer. 

♦ Die Berechnung des Medians einer zusammengefassten 

Grundgesamtheit aus den Zentralwerten der Teilgesamtheiten 

ist nicht möglich.




F(x) 

1 

0,9 

0,8 

0,7 

0,6 

0,5 

0,4 

0,3 

0,2 

0,1 

0 

0,84 

F4-F3 

0,439 

0,5-F3 

x 

Empirische Verteilungsfunktion und Median 

d 


0 - u. 4800 824 0,086 17,9 0,086 

4800 - u. 9600 549 0,057 11,9 0,143 

9600 - u. 16000 2839 0,296 46,3 0,439 

16000 - u. 25000 3908 0,408 45,3 0,847 

25000 - u. 50000 1370 0,143 5,7 0,990 

50000 - 100000 100 0,010 0,2 1,000 

Σ 9590 1,000 ./. ./. 

0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 

16000 25000 


F(x)




Beispiel I : 

Lösungen zur Berechnung des Medians 

männlich : xZ = 3200 EUR 

weiblich : xZ = 1960 EUR 

männ. + weib. : xZ = ½*(2500+3200) = 2850 EUR 

Beispiel II : 

männlich : ( 25000 16000) X Z = − 

0 061 

⋅ + 

0 408 16000 

, 

, 

X = Z 

0, 173 

12000 −7200 ⋅ + 7200 

0, 308 

X = Z 

0, 257 

16000 −9600 ⋅ + 9600 

0, 285 

weiblich : ( ) 

männ. + weib. : ( ) 

xZ = 17345,59 EUR 

xZ = 9896,10 EUR 

xD = 15371,23 EUR 

Die Berechnung von XZ erfolgt approximativ. Man gehe nach 

folgendem Lösungsmuster vor: 

(1) Bestimmung der medianen Klasse i. Die mediane Klasse ist die 

Klasse, bei der der Wert 0,5 der Verteilungsfunktion erstmalig 

überschritten wird. Dort gilt: 

Fi− 1 < 05 , ≤ Fi D.h. Der mittlere Wert liegt in der medianen Klasse. 

(2) Man nimmt an, dass in der Klasse i die Werte gleichmäßig über 

die gesamte Klassenbreite verteilt sind. 

(3) Der Anteil der Werte, die in die Klasse i fallen und für die 

Fi < 0,5 gilt, an der Gesamtzahl aller Werte der Klasse i beträgt. 

(4) Der Median 

berechnet sich : 

α i 

= 

− 

F − F 

05 , Fi 

−1 

i i−1 

u 

XZ = di⋅ α i + ei 

u 

mit ei 

= Unterschranke der Klasse i 

d i 

= Klassenbreite der Klasse i




I. Diskreter Fall 

Arithmetisches Mittel I 

Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine 

Ordnung nach ihrer Größe ist nicht notwendig. 

X : x , x , x , 

1 2 3 

... ,x n (ungeordnet) 

Als arithmetisches Mittel bezeichnet man die Größe: 

x 

n 1 

= ⋅ 

n i= 

x i 

1 

Bei der Berechnung von x werden alle Merkmalswerte xi 

verwendet. Die gesamte Information der statistischen Masse wird 

zur Berechnung von x benötigt. 

II. Klassierter Fall (bekannte teilarithmetische Mittel) 

Bei klassierten Merkmalen kann x exakt berechnet werden, wenn 

die arithmetischen Mittel der Klassen (teilarithmetische Mittel), die 

mit xi bezeichnet werden, bekannt sind. 

x ist dann das „gewogene arithmetische Mittel“ der xi , gewogen 

mit den absoluten Häufigkeiten hi. 

x = 

k 

∑ 

h ⋅ x 

h 

Sind die teilarithmetischen Mittel nicht bekannt, so lässt sich 

x näherungsweise berechnen. 

∑ 

k 

k 

k 

1 

h i 

= ⋅∑h ⋅ x = ∑ ⋅ x = ∑f 

⋅x 

n i= 

1 i= 

1 n i= 

1 

i i 

i= 

1 

k i i 

∑ 

i= 

1 

i 

i i i




Arithmetisches Mittel II 

III. Klassierter Fall (unbekannte teilarithmetische Mittel) 

Sind die x i nicht bekannt, so kann das arithmetische Mittel 

näherungsweise berechnet werden. Anstelle der x i verwendet 

* * 

man die Klassenmitte x i . Die Klassenmitte x i entspricht dem 

arithmetischen Mittel der Unter- und Oberschranke der Klasse i. 

* 1 

xi = ⋅ ei + e 

2 

Für x gilt dann näherungsweise: 

Für das exakt berechnete x gilt: 

x 

≈ 

u o ( i ) 

k 

* 

hi⋅xi k 

i= 

1 

* 

= f x 

k ∑ ⋅ i i 

i= 

1 

∑ h i 

i= 

1 

∑ 

♦ Die Summe der Abweichungen von x ist 0. Beweis : 

n 

( ) 

n 

∑ xi − x = ∑ xi − nx = n x− nx = 0 q.e.d 

i= 

1 

i= 

1 

♦ Die Summe der Abweichungsquadrate von x ist minimal. 

n 

∑ ( xix) i= 

1 

2 

− = min ! 

♦ Das arithmetische Mittel einer zusammengefassten Grundgesamtheit 

errechnet sich aus den gewogenen Mittelwerten der 

Teilgesamtheiten. Als Gewichte dienen die Besetzungszahlen 

der Teilgesamtheiten. 

♦ Die Berechnung von x ist nur bei quantitativen Merkmalen 

sinnvoll. 

♦ x ist immer dann ein adäquater Mittelwert, wenn die Ersatzwerteigenschaft 

betont wird.




Lösungen zur Berechnung des Arithmetischen Mittels 

Beispiel I : 

männlich : x = 3200, 91 EUR 

weiblich : x = 2122,86 EUR 

männ. + weib. : 11⋅ 3200,91 + 7⋅ 2122, 86 

x = 

11+ 7 

Beispiel II : 

= 2781, 67 EUR 

Die xi sind nicht bekannt. Aus diesem Grund werden die 

* 

Klassenmitten x herangezogen. 

i 

Männlich : 

Klasse Klassenmitte hi hixi * 

1 2400 824 1977600 

2 7200 549 3952800 

3 12800 2839 36339200 

4 20500 3908 80114000 

5 37500 1370 51375000 

6 75000 100 7500000 

Gesamt -- 9590 181258600 

x = 18900,79 

Weiblich : 

Klasse Klassenmitte hi hixi * 

1 1200 426 511200 

2 3600 358 1288800 

3 6000 517 3102000 

4 9600 1219 11702400 

5 18500 1327 24549500 

6 62500 116 7250000 

Gesamt -- 3963 48403900 

x = 12213,95 

9590⋅ 18900, 79 + 3963⋅12213, 95 

Männl. + Weibl. : x = 

= 16945, 51 EUR 

9590 + 3963




Geometrisches Mittel I 



Als geometrisches Mittel bezeichnet man die Größe: 

bzw. wenn man logarithmiert : 

Der Logarithmus des geometrischen Mittels ist gleich dem 

arithmetischen Mittel der Logarithmen der einzelnen 

Merkmalswerte X i. 

Das geometrische Mittel erweist sich als sinnvoller 

Mittelwert, wenn der Durchschnitt relativer Größen 

berechnet werden soll. 

Insbesondere bei der Berechnung der durchschnittlichen, 

periodischen Wachstumsrate von Zeitreihen ist das geometrische 

Mittel zu bestimmen. 

Beispiel : 

X : x , x , x , 

1 2 3 

n x = x ⋅x ⋅ ⋅x 

... ,x n (ungeordnet) 

g 1 2 ... n 

n 

1 

log x = ⋅ ∑ log x 

= 1 

g i 

n i 

Jahr Kapital Zins Wachstumsfaktor 

0 100,0 -- -- 

1 110,0 10,00 % 1,1000 

2 115,5 5,00 % 1,0500 

3 121,0 4,76 % 1,0476 

4 135,5 12,00 % 1,1200




Geometrisches Mittel II 

Berechnung der durchschnittlichen, jährlichen Verzinsung: 

Der Wert xg entspricht dem durchschnittlichen, jährlichen 

Wachstumsfaktor. Multipliziert man den Anfangswert des Kapitals 

(100,0) n mal mit xg erhält man den Endwert des Kapitals (135,5). 

Beachte: 

4 4 

x g = 11 , ⋅1, 05⋅1, 0476 ⋅ 112 , = 1, 355 = 1, 07894 

Die Größe n im Wurzelausdruck ist nicht gleich der Anzahl der 

absoluten Daten (5). Vielmehr bedeutet n hier die Anzahl der 

Wachstumsfaktoren. 

Berechnet wird n über: 

n = N −1 mit N = Anzahl der absoluten Werte 

Definition des Wachstumsfaktors F : 

yt 

yt = F⋅yt−1→ F = F = Wachstumsfaktor 

y 

Definition der Wachstumsrate g : 

Die Wachstumsrate g ergibt sich aus: 

Die durchschnittl. Wachstumsrate ist: 

Im Beispiel wurde das Kapital durchschnittlich mit xg = 1,07894 

verzinst. Dies entspricht einer durchschnittlichen Wachstumsrate 

von g = 7, 894 %. 

⎡ Endwert ⎤ 

Alternative Berechnung : g = n ⎢ 

− ⎥ 

⎣ Anfangswert ⎦ 

⋅ 1 100 % 

t−1 

[ ] 

g = F−1 

⋅100 

% 

[ ] 

g = xg−1 ⋅100 

%




Spannweite : 

Spannweite 



Dabei bedeutet: 

x 

1 

x 

i 

x 

n 

→ 

→ 

→ 

X : x , x , x , ... , x 

1 2 3 n 

der kleinste Merkmalswert 

der i.te Merkmalswert der geordneten Reihe 

der größte Merkmalswert 

Die Differenz zwischen dem größten und dem kleinsten 

Merkmalswert bezeichnet die Spannweite R. 

R = x − x = x − x 

max min n 1 

Bei klassierten Merkmalen errechnet sich die Spannweite aus der 

Differenz zwischen Oberschranke der Klasse k und Unterschranke 

der 1. Klasse (Klasse i = 1 ... k). 

o u 

R = ek−e1 ♦ Die Spannweite ist nur ein grobes Maß zur Bestimmung der 

Streuung einer Verteilung. 

♦ „Ausreißer“ beeinflussen in hohem Maße ihren Wert.




Quartilsabweichung 



X : x , x , x , 

1 2 3 

... ,x n 

Für den Median gilt bekanntlich: F(xZ) = 0,5. 

Hieraus folgt für die Quartilsabweichung QA: 

Die Quartilsabweichung gibt die durchschnittliche Streuung 

von 50 % der Merkmalswerte um den Median x Z an. 

Gesucht werden zwei Werte für die gelten soll: 

u 

Fx ( ) = 025 , 

o 

Fx ( ) = 075 , 

Zwischen den beiden Werten liegen definitionsgemäß 50 % allen 

erhobenen Merkmalswerts. 

Die Quartilsabweichung ist definiert als die mittlere Streubreite der 

beiden Quartile. 

o 

u 

[ ( Z) ( Z ) ] 

1 

QA = 

2 

x − x + x −x 

1 o u 

QA = ⋅( x −x) 

2




Lösungen zur Quartilsabweichung (Beispiel I, Männer) 

Ordnen der gegebenen Werte : 

1650 2030 2030 3200 3200 3200 3200 3700 4100 4100 4800 

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 

Bestimmung von x u und x o : 

Allgemein : Reihe in 2 gleich große Hälften aufteilen 

(a) bei ungeradem n xZ = xn+1 

2 

(b) Bei geradem n Re ihe 1 : x ... x 

1 n 

2 

Reihe 

2 : x ... x 

n n 

2 1 + 

xu : Median der Teilreihe 1 (gerades n = 6) 

u 1 ⎛ 

x = ⋅ ⎜ xn 2 ⎝ 

⎞ 1 

+ xn 

⎟ = ⋅ ( 2030 + 3200) = 2615 EUR 

+ ⎠ 2 

2 2 1 

xo : Median der Teilreihe 2 (gerades n = 6) 

o 1 ⎛ 

x = ⋅ ⎜ xn 2 ⎝ 

⎞ 1 

+ xn 

⎟ = ⋅ ( 3700 + 4100) = 3900 EUR 

+ ⎠ 2 

QA : 

1 

2 

Interpretation : 

2 2 1 

Median 

o u 1 

⋅( x − x ) = ⋅( 3900 − 2615) = 642, 5 EUR 

2 

xZ gehört zu 

beiden 

Reihen. 

50% der Einkommen der männlichen Arbeitnehmer werden in 

einem Abstand von ± 642,50 EUR um den Median im Durchschnitt 

angetroffen.




Lösungen zur Quartilsabweichung (Beispiel II, Männer) 

1. Schritt : 

Bestimmung der Quartilsklassen i u und i o. (Klassen in denen F(x) 

erstmals 25% bzw. 75% überschreitet.) 

Quartilsklasse i u = 3 : 9600 - 16000 EUR 

Quartilsklasse i o = 4 : 16000 - 25000 EUR 

2. Schritt : 

Bestimmung von x u. 

x 

u 

= d 

3 

⋅α 

+ e 

0, 

25 − F 

α 3 = 

F − F 

x 

u 

3 

3 

2 

2 

u 

3 

= 

mit 

0, 

25 

= 6400⋅ 

0, 

361+ 

9600 = 11910, 

40 EUR 

3. Schritt : 

d 

0, 

439 

Bestimmung von x o. 

x 

o 

= d 

4 

⋅α 

+ e 

0, 

75 − F3 

α 4 = 

F − F 

x 

o 

4 

4 

3 

u 

4 

= 

mit 

0, 

75 

0, 

847 

3 

= 16000 − 9600 = 6400 

− 0, 

143 

= 

− 0, 

143 

d 

4 

0, 

361 

= 25000 −16000 

= 9000 

− 0, 

439 

= 

− 0, 

439 

0, 

762 

= 9000⋅ 

0, 

762 + 16000 = 22860, 

29 EUR 

4. Schritt : 

1 

2 

und 

und 

e 

u 

3 

e 

= 9600 

u 

4 

= 16000 

Bestimmung von QA. QA = ⋅( 

22860, 

29 −11910, 

40) 

= 5474, 

95 EUR 

Interpretation : 

50% der männlichen Einkommen befinden sich im Durchschnitt in 

einem Abstand von ± 5474,95 EUR um den Median !




Varianz, Standardabweichung, Variationskoeffizient 



Die Varianz des Merkmals X ( = σ2 ) ist das arithmetische 

Mittel der Abstandsquadrate vom Mittelwert x . 

Es gilt der Zerlegungssatz. D.h. die Varianz lässt sich oft einfacher 

berechnen über: 

Die Quadratwurzel aus der Varianz heißt Standardabweichung 

σ x. 

Bei klassierten Merkmalen kann die Varianz nur sehr grob 

angenähert berechnet werden. 

2 

σ x 

≈ 

k 

∑ 

i= 

1 

* ( ) 

h ⋅ x −x 

X : x 1 

2 

, x , x , 

2 3 

( ) 

... , x n (ungeordnet) 

1 

= ⋅ − 

n 

n 

∑ ( x x) 

2 

σ x i 

i= 

1 

n 

n 

2 1 2 

2 1 2 

σx = ⋅∑( xi −x) ⇔ σx 

= ⋅∑xi − x 

n i= 

1 

n i= 

1 

n 

n 

1 2 

1 2 

σx = ⋅∑( xi −x) ⇔ σx 

= ⋅∑xi − x 

n i= 

1 

n i= 

1 

i i 

k 

∑ h i 

i= 

1 

k 

* 

2 

* 

= ∑fi⋅ x i − x mit x i 

i= 

1 

k 

* 

= Klassenmitten, x = ∑fi⋅xi 

i=1 

Der Variationskoeffizient V beschreibt die Streuung relativ 

zur Höhe des Mittelwertes. 

x V = 

x 

σ 

2 

2 

2




Lösung zu Varianz, Standardabweichung, 

Variationskoeffizient im Beispiel I 

lfd. Nr. i xi (weiblich) xi 2 (weiblich) xi (männl.) xi 2 (männl.) 

1 1710 2924100 1650 2722500 

2 1960 3841600 2030 4120900 

3 2500 6250000 4800 23040000 

4 1480 2190400 3200 10240000 

5 1710 2924100 3700 13690000 

6 2300 5290000 4100 16810000 

7 3200 10240000 3200 10240000 

8 -- -- 2030 4120900 

9 -- -- 3200 10240000 

10 -- -- 4100 16810000 

11 -- -- 3200 10240000 

Σ 14860 33660200 35210 122274300 

weiblich : männlich : 

14860 

x = = 2122, 86 

7 

33660200 

σ x = −2122, 

86 

7 

2 

σ = 302077, 5 

σ 

2 2 

x 

x 

= 302077, 5 = 549, 62 

Variationskoeffizient : 

weiblich : männlich : 

35210 

x = = 3200, 91 

11 

122274300 

σ x = −3200, 

91 

11 

2 

σ = 870020, 62 

2 2 

σ x 

V = 

x 

549, 62 

σ x 

= = 026 , 

V = 

2122, 86 

x 

932, 75 

= = 029 , 

3200, 91 

V = 0,26 < V = 0,29 

σ 

x 

x 

= 870020, 62 = 932, 75

Teil 1

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?