Teil 1
Teil 1
Teil 1
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Vorlesungsskript<br />
Statistik<br />
Grundstudium<br />
Modul G1-3.2 Statistik I<br />
<strong>Teil</strong> 1<br />
Fachhochschule<br />
der<br />
Deutschen Bundesbank<br />
Dr. Dietmar Hubrich
Dr. Dietmar Hubrich Statistik I Seite 2<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
G1-3.2 Statistik I (<strong>Teil</strong> 1)<br />
1 Aufgaben und Ziele der Statistik<br />
2 Träger der Statistik und Grundbegriffe<br />
2.1 Amtliche und nichtamtliche Statistik<br />
2.2 Statistische Einheiten und statistische Massen<br />
2.3 Merkmale, Merkmalsträger und Metrik<br />
3 Formen und Arten der Datenerhebung<br />
4 Aufbereitung des Datenmaterials<br />
4.1 Reihen und Häufigkeiten<br />
4.2 Empirische und theoretische Verteilungen<br />
4.3 Grafische Darstellungen<br />
5 Mittelwerte und Streuungsmaße<br />
5.1 Lageparameter<br />
5.1.1 Modalwert (dichtester Wert)<br />
5.1.2 Median (Zentralwert)<br />
5.1.3 Arithmetisches Mittel<br />
5.1.4 Geometrisches Mittel<br />
5.2 Streuungsparameter<br />
5.2.1 Spannweite (Streubreite)<br />
5.2.2 Quartilsabweichung<br />
5.2.3 Varianz, Standardabweichung und Variationskoeffizient<br />
Literatur: Fahrmeier, L.; Künstler, R.; Pigeot, I.; Tutz, G. „Statistik“ – Der Weg zur<br />
Datenanalyse –, Springer Verlag 7. Aufl.<br />
Schulze, P.- M. „Beschreibende Statistik“, Oldenbourg Verlag,“<br />
Bourier, G. „Beschreibende Statistik - Praxisorientierte Einführung<br />
mit Aufgaben und Lösungen -“, Gabler Verlag 5. Aufl.<br />
sowie jedes andere Lehrbuch der Statistik
Dr. Dietmar Hubrich Statistik I Seite 3<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Methoden der Wissensermittlung<br />
Naturwissenschaft<br />
Beobachtung der Umwelt<br />
Erklärungsversuch des Phänomens<br />
durch „Hypothese“<br />
Experiment falsifiziert<br />
verifiziert<br />
„Theorie“<br />
(bleibt bestehen bis Gegenbeispiel<br />
gefunden wird)<br />
wenn lange Zeit nicht falsifiziert<br />
„Gesetz“<br />
Konsequenzen für die Statistik :<br />
Sozialwissenschaft<br />
Beobachtung der Umwelt<br />
Erklärungsversuch des Phänomens<br />
durch „Hypothese“<br />
Test der „Hypothese“ fast<br />
ausschließlich an Modellen.<br />
Experiment eher die Ausnahme<br />
verifiziert ? falsifiziert<br />
wegen Zeitvarianz und Raumvarianz<br />
der Hypothesen hat die Theorie nur<br />
begrenzte Gültigkeit.<br />
Wenn lange Zeit nicht falsifiziert<br />
„Quasi-Gesetz“<br />
♦ Prozess der Falsifizierung erfolgt viel öfter in den Sozialwissenschaften als in<br />
den Naturwissenschaften.<br />
♦ Ständiger Bedarf an neuen Hypothesen, die getestet werden müssen.<br />
♦ Sehr hoher Informationsbedarf.<br />
♦ Datenangebot immer wesentlich kleiner als Datennachfrage.<br />
Wenn : Datenangebot
Dr. Dietmar Hubrich Statistik I Seite 4<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Arbeitsweise des Statistischen Bundesamtes<br />
Gemäß §2 des Gesetzes über die Statistik für Bundeszwecke besteht<br />
die Aufgabe des Statistischen Bundesamtes in:<br />
⇒ Statistiken für Bundeszwecke technisch und methodisch<br />
vorzubereiten<br />
⇒ Die Ergebnisse für den Bund zu sammeln, zu erheben und<br />
aufzubereiten<br />
⇒ Volkswirtschaftliche Gesamtrechnungen aufzustellen<br />
⇒ Statistiken des Auslands zu sammeln und darzustellen<br />
Zu diesem Zweck veröffentlicht das Amt:<br />
⇒ Statistisches Jahrbuch für die Bundesrepublik Deutschland<br />
⇒ Monatszeitschrift „Wirtschaft und Statistik“<br />
⇒ Fachserien<br />
Die Aufgaben der Statistischen Landesämter umfassen:<br />
⇒ Erhebungen bei den einzelnen Merkmalsträgern<br />
⇒ Kumulierung der Ergebnisse zu Landesergebnissen<br />
⇒ Bereitstellung des Landesergebnisses zur Ermittlung des<br />
Bundesergebnisses.<br />
⇒ Vereinheitlichung aller Abgrenzungen hinsichtlich des<br />
Berichtskreises und der erhobenen Merkmale
Dr. Dietmar Hubrich Statistik I Seite 5<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Statistische Einheit und Statistische Masse<br />
Begriff : Statistische Einheit<br />
Die statistische Einheit ist das Einzelobjekt der statistischen<br />
Untersuchung. Sie ist der Träger der bei der Untersuchung<br />
interessierenden Information.<br />
Jede statistische Einheit muss<br />
Identifikationskriterien<br />
der statistischen<br />
♦ sachlich<br />
♦ räumlich<br />
Einheit<br />
♦ zeitlich eindeutig identifizierbar bzw.<br />
abgrenzbar sein.<br />
Begriff : Statistische Masse<br />
Die statistische Masse ist die Gesamtheit (Menge) von<br />
statistischen Einheiten mit übereinstimmenden<br />
Identifikationsmerkmalen.<br />
Alle Einheiten einer statistischen Masse sind sachlich, räumlich<br />
und zeitlich gleich abgegrenzt.<br />
Begriff : Strukturbruch<br />
Verändern sich die Identifikationsmerkmale der statistischen<br />
Einheiten einer statistischen Masse, so bezeichnet man dieses<br />
Phänomen als Strukturbruch.<br />
Beispiel : Volkszählung in der Bundesrepublik Deutschland:<br />
sachlich : jede lebende menschliche Person<br />
räumlich : Angabe des Gebietes, hier BRD<br />
zeitlich : Angabe eines Stichtages, z.B. 1.5.2011
Dr. Dietmar Hubrich Statistik I Seite 6<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriff : Bestandsmasse<br />
Bestands- und Ereignismassen<br />
Bestandsmassen sind statistische Massen, deren Einheiten eine<br />
gewisse Lebensdauer in der Zeit aufweisen. Die Erfassung von<br />
Bestandsmassen kann und muss deswegen stichtagsbezogen<br />
erfolgen.<br />
Beispiel : Weinvorrat im Keller<br />
1.1.2011 → 12 Flaschen<br />
1.2.2011 → 8 Flaschen<br />
1.3.2011 → 10 Flaschen<br />
Problem : Stichtagsunabhängigkeit<br />
durchschnittlicher<br />
Bestand für das<br />
I. Quartal →<br />
12 + 8 + 10<br />
= 10 Flaschen<br />
3<br />
Um Bestände auch stichtagsunabhängig angeben zu können,<br />
ist es sinnvoll, eine Bestandsmasse über einen Zeitraum hinweg<br />
durch ihren Durchschnittsbestand zu definieren.<br />
Begriff : Ereignismasse<br />
Ereignismassen sind statistische Massen, deren Einheiten zu<br />
ganz bestimmten Zeitpunkten auftreten, die im Zeitablauf zum<br />
Gesamtergebnis kumulieren. Die Erfassung von Ereignismassen<br />
kann und muss deswegen zeitraumbezogen erfolgen.<br />
Beispiel : Demoskopische Daten<br />
Geburten im Laufe des Jahres alle Einzelergebnisse<br />
Todesfälle im Laufe des Jahres des Jahres werden<br />
Zuwanderung im Laufe des Jahres kumuliert.
Dr. Dietmar Hubrich Statistik I Seite 7<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriff : Merkmal<br />
Merkmale und Merkmalsträger I<br />
Die Eigenschaften einer statistischen Einheit, die für die<br />
statistische Untersuchung relevant sind, heißen statistische<br />
Merkmale.<br />
Begriff : Merkmalsträger<br />
Träger der Merkmale, als Besitzer bestimmter interessierender<br />
Eigenschaften, sind immer die statistischen Einheiten selbst.<br />
Begriff : Merkmalsausprägung<br />
Alle möglichen Zustände, die ein Merkmal annehmen kann,<br />
heißen Merkmalsausprägungen. Sie können vorkommen als:<br />
abzählbare oder diskrete ↔ nicht-abzählbare oder stetige<br />
Merkmalsausprägungen.<br />
Beispiele :<br />
Noten in einer Klausur.<br />
Geschlecht einer Person.<br />
Begriff : Merkmalswerte<br />
Körpergewicht von Personen.<br />
Einkommen von Familien.<br />
Derjenige Wert, den ein Merkmal von allen möglichen<br />
Merkmalsausprägungen tatsächlich annimmt, heißt<br />
Merkmalswert.<br />
Er ist das eigentliche Datum, der Träger der Information, der in<br />
einer statistischen Analyse verarbeitet wird.<br />
Beispiel :<br />
Merkmalsausprägung → Noten ; Merkmalswert → sehr gut
Dr. Dietmar Hubrich Statistik I Seite 8<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Merkmale und Merkmalsträger II<br />
Merkmalswerten, Merkmalsausprägungen oder Merkmalen<br />
können zwei großen Klassifizierungen zugeordnet werden:<br />
Begriff : Quantitative Merkmale<br />
Quantitative Merkmale sind Merkmale, denen Zahlen<br />
zugeordnet werden können und die durch diese Zahlen<br />
vollständig beschreibbar sind.<br />
Dies bedeutet insbesondere:<br />
♦ Quantitative Merkmale besitzen stets eine Dimension.<br />
♦ Es können Abstände angegeben werden.<br />
♦ Die Messvorschrift ist stets eine kardinale Messmetrik.<br />
♦ Schlüsselzahlen sind keine quantitativen Merkmale.<br />
Begriff : Qualitative Merkmale<br />
Qualitative Merkmale sind Merkmale, die nicht durch<br />
dimensionsbehaftete Zahlen beschreibbar sind. Voneinander<br />
unterscheidbar werden sie nur durch ihre Beschaffenheit oder<br />
Bedeutung.<br />
Dies bedeutet insbesondere:<br />
♦ Schlüsselzahlen sind qualitative Merkmale.<br />
♦ Es können keine Differenzen berechnet werden.<br />
♦ Qualitative Merkmale sind dimensionslos.<br />
♦ Die Messvorschrift ist eine nominale oder ordinale<br />
Messmetrik.<br />
Problem :<br />
Sind qualitative oder quantitative Merkmalsausprägungen stetig,<br />
so ist es nicht möglich einen exakten Merkmalswert zu erheben.<br />
In einem solchen Fall, wird man versuchen die Abzählbarkeit durch<br />
Bildung von Klassen zu ermöglichen.<br />
→ Klassierung von Daten
Dr. Dietmar Hubrich Statistik I Seite 9<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriff : nominale Metrik<br />
Messniveaus von Merkmalen I<br />
Die nominale Metrik ist eine Messvorschrift für Merkmalsausprägungen.<br />
Sie beschränkt sich auf die Untersuchung der<br />
Gleichheit oder Ungleichheit mit einem vorgegebenen oder<br />
erwarteten Erhebungsmerkmal.<br />
Dabei gilt insbesondere:<br />
♦ Nominale Metrik ist auch anwendbar auf qualitative<br />
Merkmale.<br />
♦ Nominale Metrik beruht auf dem Prinzip der vergleichenden<br />
Zuordnung.<br />
♦ Die Reihenfolge der Merkmalswerte ist beliebig. Es erfolgt<br />
keine Wertung.<br />
Begriff : ordinale Metrik<br />
Die ordinale Metrik ist eine Messvorschrift für bewertbare<br />
Merkmalsausprägungen. Auch hier steht die Gleichheit oder<br />
Ungleichheit mit einem vorgegebenen oder erwarteten Erhebungsmerkmal<br />
im Vordergrund.<br />
Dabei gilt insbesondere:<br />
♦ Ordinale Metrik ist auch anwendbar auf qualitative<br />
Merkmale.<br />
♦ Ordinale Metrik beruht ebenfalls auf dem Prinzip der<br />
vergleichenden Zuordnung.<br />
♦ Die Reihenfolge der Merkmalswerte ist nicht beliebig. Es<br />
erfolgt immer eine Einstufung in eine Rangskala.
Dr. Dietmar Hubrich Statistik I Seite 10<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriff : kardinale Metrik<br />
Messniveaus von Merkmalen II<br />
Die kardinale Metrik ist eine Messvorschrift für zahlenmäßig<br />
erklärbare Merkmalsausprägungen.<br />
Dabei gilt insbesondere:<br />
♦ Anwendung nur auf quantitative Merkmale.<br />
♦ Es können Abstände und Relationen gemessen werden.<br />
♦ Es können nur Merkmale erfasst werden, die eine Dimension<br />
besitzen.<br />
Vergleich der Messvorschriften:<br />
Messvorschrift Erfassbare Merkmale<br />
nominale Metrik qualitative und<br />
quantitative Daten<br />
ordinale Metrik ordenbar qualitative<br />
und quantitative<br />
Daten<br />
kardinale Metrik nur quantitative<br />
Daten<br />
Fazit des Vergleichs :<br />
Anforderung an das<br />
Datenmaterial<br />
schwächste Anforderung<br />
an die Messbarkeit eines<br />
Merkmals.<br />
mittlere Anforderung an<br />
die Messbarkeit eines<br />
Merkmals.<br />
höchste Anforderung an<br />
die Messbarkeit eines<br />
Merkmals.<br />
Die strengste Metrik, also die kardinale Metrik, beinhaltet die<br />
schwächste Metrik, also die nominale Metrik. Alles, was mit<br />
einer kardinalen Metrik gemessen werden kann, kann auch<br />
mit einer ordinalen oder nominalen Metrik gemessen werden.
Dr. Dietmar Hubrich Statistik I Seite 11<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriffe :<br />
Urliste<br />
Ungeordnete<br />
Statistische<br />
Reihe<br />
Ordnungskriterien<br />
der<br />
geordneten<br />
statistischen<br />
Reihe<br />
Besetzungszahl<br />
Absolute<br />
Häufigkeit der<br />
Klasse i<br />
Bei k-Klassen<br />
gilt:<br />
Relative<br />
Häufigkeit der<br />
Klasse i<br />
Bei k-Klassen<br />
gilt:<br />
Reihen, Häufigkeiten und Verteilungen I<br />
Sammlung von Merkmalswerten einer Erhebung<br />
X : x1 , x2 , x3 ,..., xn<br />
n = Gesamtzahl der einbezogenen statistischen<br />
Einheiten.<br />
ordinal/kardinal → Größe der Zahl oder Rang<br />
nominal → sachliche Ordnung<br />
Zeitpunkt der<br />
Erhebung → Zeitreihen, Indexreihen, etc..<br />
Anzahl der Merkmalsträger pro Klasse<br />
Besetzungszahl der i.ten Klasse = hi<br />
k<br />
= ∑<br />
i=<br />
1<br />
n h i<br />
n = Gesamtzahl der einbezogenen statistischen<br />
Einheiten.<br />
hi<br />
fi<br />
=<br />
n<br />
fi = relative Häufigkeit der Klasse i<br />
k<br />
∑ fi =<br />
i=<br />
1<br />
1 oder 100 %
Dr. Dietmar Hubrich Statistik I Seite 12<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Begriffe:<br />
HäufigkeitstabelleHäufigkeitsverteilung<br />
Reihen, Häufigkeiten und Verteilungen II<br />
Tabellarische Darstellung der absoluten Häufigkeiten.<br />
Zusammenstellung der Merkmalswerte in Klassen mit<br />
zugehörigen absoluten/relativen Häufigkeiten.<br />
Beispiel : Soziale Stellung des Haushaltsvorstands (BRD, 1969)<br />
Klasse i<br />
Soziale<br />
Stellung<br />
xi<br />
Absolute<br />
Häufigkeit hi<br />
[in 100.000]<br />
Relative<br />
Häufigkeit fi<br />
Verteilungsfunktion<br />
F(xi)<br />
1 Landwirt 8 0,04 0,04<br />
2 Selbständig 16 0,07 0,11<br />
3 Beamter 12 0,06 0,17<br />
4 Angestellter 36 0,17 0,34<br />
5 Arbeiter 63 0,31 0,66<br />
6 Nicht Erwerbstätige<br />
71<br />
0,34<br />
1,00<br />
Σ: 206 1,00 ./.<br />
Begriff : Verteilungsfunktion<br />
Die Verteilungsfunktion F(x) für das Merkmal x ist die Funktion,<br />
die jedem Merkmalswert xi den Anteilswert aller statistischen<br />
Einheiten zuordnet, die einen Merkmalswert xi oder kleiner<br />
i h i<br />
j<br />
aufweisen: F( xi)=<br />
∑ = ∑fj<br />
j = 1,2,3,...,k<br />
j=<br />
1 n j=<br />
1<br />
(k ist die Anzahl der Klassen oder Häufungspunkte)
Dr. Dietmar Hubrich Statistik I Seite 13<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Empirische und theoretische Verteilungen<br />
Begriff : empirische Verteilungsfunktion<br />
Unter einer empirischen Verteilungsfunktion versteht man die<br />
Kumulierung der relativen Häufigkeiten von klassierten, real<br />
erhobenen Merkmalswerten.<br />
Beispiel : Schlagball - Weitwürfe von Schülern<br />
Klasse i Weite x in m Häufigkeit h i<br />
relative<br />
Häufigkeit f i<br />
Besetzungsdichte<br />
f i/d i<br />
Verteilungsfunktion<br />
F(x i)<br />
1 15
Dr. Dietmar Hubrich Statistik I Seite 14<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Beispielfragestellungen zu charakteristischen Kennziffern<br />
Beispiel I:<br />
In der Schlossbank betrugen die monatlichen Gehälter der männlichen und<br />
weiblichen Angestellten (in EUR):<br />
Männliche Arbeitnehmer :<br />
1650 , 2030 , 4800 , 3200 , 3700 , 4100 , 3200 , 2030 , 3200 , 4100 , 3200<br />
Weibliche Arbeitnehmer :<br />
1710 , 1960 , 2500 , 1480 , 1710 , 2300 , 3200<br />
Beispiel II:<br />
Im Konzern A betrugen die Einkommen der männlichen und weiblichen<br />
Arbeitnehmer (in EUR):<br />
Männliche Arbeitnehmer :<br />
Einkommen Arbeitnehmer<br />
X<br />
hi<br />
0 - u. 4800 824<br />
4800 - u. 9600 549<br />
9600 - u. 16000 2839<br />
16000 - u. 25000 3908<br />
25000 - u. 50000 1370<br />
50000 - 100000 100<br />
Gesamt 9590<br />
Weibliche Arbeitnehmer :<br />
Einkommen Arbeitnehmer<br />
X<br />
hi<br />
0 - u. 2400 426<br />
2400 - u. 4800 358<br />
4800 - u. 7200 517<br />
7200 - u. 12000 1219<br />
12000 - u. 25000 1327<br />
25000 - 100000 116<br />
Gesamt 3963<br />
Diese Beispiele dienen als<br />
Übungsstandard. Gemäß<br />
den vorkommenden<br />
Merkmalsarten<br />
klassiert, quantitativ bzw.<br />
diskret, quantitativ<br />
sind unterschiedliche<br />
Berechnungsmethoden zur<br />
Bestimmung der Lage- und<br />
Streuungsparameter<br />
anzuwenden.
Dr. Dietmar Hubrich Statistik I Seite 15<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Vollständige Häufigkeitstabelle zum Beispiel II<br />
Männliche Arbeitnehmer :<br />
Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />
0 - u. 4800 824 0,086 17,9 0,086<br />
4800 - u. 9600 549 0,057 11,9 0,143<br />
9600 - u. 16000 2839 0,296 46,3 0,439<br />
16000 - u. 25000 3908 0,408 45,3 0,847<br />
25000 - u. 50000 1370 0,143 5,7 0,990<br />
50000 - 100000 100 0,010 0,2 1,000<br />
Weibliche Arbeitnehmer :<br />
Σ 9590 1,000 ./. ./.<br />
Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />
0 - u. 2400 426 0,107 44,8 0,107<br />
2400 - u. 4800 358 0,090 37,6 0,197<br />
4800 - u. 7200 517 0,130 54,4 0,327<br />
7200 - u. 12000 1219 0,308 64,1 0,635<br />
12000 - u. 25000 1327 0,335 25,8 0,971<br />
25000 - 100000 116 0,029 0,4 1,000<br />
Σ 3963 1,000 ./. ./.
Dr. Dietmar Hubrich Statistik I Seite 16<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Besetzungsdichte fi/di *10^6<br />
Besetzungsdichte fi/di *10^6<br />
50<br />
40<br />
30<br />
20<br />
10<br />
Histogramme zum Beispiel II<br />
Histogramm : Männliche Arbeitnehmer (Beispiel 2)<br />
0<br />
0 20000 40000 60000 80000 100000 120000<br />
Einkommen in EUR<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
Histogramm : Weibliche Arbeitnehmer (Beispiel 2)<br />
0<br />
0 20000 40000 60000 80000 100000 120000<br />
Einkommen in EUR<br />
Die Histogramme lassen die Vermutung zu, dass die männlichen<br />
Arbeitnehmer des Konzerns A prinzipiell mehr verdienen als ihre<br />
Kolleginnen.<br />
Eine exakte Bestätigung dieser Vermutung lässt die Anschauung<br />
nicht zu. Hierfür ist es notwendig, Lage- bzw. Streuungsparameter<br />
zu berechnen.
Dr. Dietmar Hubrich Statistik I Seite 17<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Modalwert (Modus, häufigster Wert)<br />
Als Modalwert der Verteilung eines Merkmals bezeichnet man den<br />
Merkmalswert, der am häufigsten auftritt.<br />
(1) Bei qualitativen Merkmalen und bei diskreten quantitativen<br />
Merkmalen:<br />
Der Merkmalswert, für den die relative oder absolute<br />
Häufigkeit f i ihr Maximum erreicht, bezeichnet den<br />
Modalwert X D.<br />
(2) Bei stetigen quantitativen Merkmalen werden Klassen gebildet.<br />
Für klassierte Merkmale gilt:<br />
Die Klasse mit der größten Besetzungsdichte<br />
(Häufigkeitsdichte) heißt modale Klasse. Die<br />
Klassenmitte der modalen Klasse bezeichnet den<br />
Modalwert X D.<br />
♦ Der Modalwert hat nur dann einen Sinn, wenn die Verteilung<br />
eingipflig ist, also ein eindeutiges, globales Maximum besitzt.<br />
♦ Auch bei nominalskalierten Merkmalen ist der Modalwert ein<br />
sinnvoller Mittelwert.<br />
♦ Die Berechnung eines Modalwertes einer zusammengefassten<br />
Grundgesamtheit aus den Modalwerten der <strong>Teil</strong>gesamtheiten<br />
ist nicht möglich.
Dr. Dietmar Hubrich Statistik I Seite 18<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Beispiel I :<br />
Lösungen zur Berechnung des Modalwertes<br />
männlich : xD = 3200 EUR<br />
weiblich : xD = 1710 EUR<br />
männ. + weib. : xD = 3200 EUR<br />
Beispiel II :<br />
männlich : Modale Klasse :<br />
9600 - unter 16000<br />
weiblich : Modale Klasse :<br />
7200 - unter 12000<br />
männ. + weib. : Modale Klasse :<br />
9600 - unter 16000<br />
xD = 12800 EUR<br />
xD = 9600 EUR<br />
xD = 12800 EUR<br />
Zur Berechnung des Modalwertes Beispiel II (männ. + weib.) ist es<br />
notwendig eine neue gemeinsame Häufigkeitstabelle zu erstellen.<br />
Bei unterschiedlichen Klassenbreiten verwendet man dazu die<br />
Methode der Zuschlagsrechnung (Rechenschema s. nächste<br />
Seite). Die Intervallstruktur wird dabei von der <strong>Teil</strong>gesamtheit mit<br />
der größeren Anzahl an Merkmalsträgern übernommen.<br />
Die vollständige Häufigkeitstabelle hat dann folgendes Aussehen:<br />
Männliche + Weibliche Arbeitnehmer (Beispiel II) :<br />
Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />
0 - u. 4800 1608 0,119 24,7 0,119<br />
4800 - u. 9600 1675 0,124 25,7 0,243<br />
9600 - u. 16000 3857 0,285 44,4 0,528<br />
16000 - u. 25000 4827 0,356 39,6 0,884<br />
25000 - u. 50000 1409 0,104 4,1 0,988<br />
50000 - 100000 177 0,013 0,3 1,000<br />
Σ 13553 1,000 ./. ./.
Dr. Dietmar Hubrich Statistik I Seite 19<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Rechenschema zur Häufigkeitstabelle Beispiel II<br />
Die <strong>Teil</strong>gesamtheit der männlichen Arbeitnehmer besitzt die größte<br />
Anzahl an Merkmalsträgern. Diese Intervallstruktur ist Grundlage für<br />
die zusammengefasste Häufigkeitstabelle:<br />
Klasse<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
Intervall<br />
0 - u. 4800<br />
4800 - u. 9600<br />
9600 - u. 16000<br />
16000 - u. 25000<br />
25000 - u. 50000<br />
50000 - 100000<br />
Σ<br />
Häufigkeit<br />
824 + 426 + 358 = 1608<br />
1219<br />
549 + 517 +<br />
2<br />
= 1675<br />
609,5 wird auf 609 gerundet. (Rest 610)<br />
Zuschlag untere Klasse.<br />
16000 − 12000<br />
2839 + 610 +<br />
⋅ 1327<br />
13000<br />
= 3857<br />
→ + 408 (Rest 919)<br />
3908 + 919 = 4827<br />
1370<br />
+<br />
50000 − 25000<br />
⋅ 116<br />
75000<br />
= 1409<br />
→ + 39 (Rest 77)<br />
100 + 77 = 177<br />
13553
Dr. Dietmar Hubrich Statistik I Seite 20<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
I. Diskreter Fall<br />
Median (Zentralwert) I<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />
nach ihrer Größe geordnet.<br />
Dabei bedeutet:<br />
x<br />
1<br />
x<br />
i<br />
x<br />
n<br />
→<br />
→<br />
→<br />
der kleinste Merkmalswert<br />
der i.te Merkmalswert der geordneten Reihe<br />
der größte Merkmalswert<br />
Als Median der Verteilung eines Merkmals bezeichnet man den<br />
mittleren Merkmalswert der Reihe. D.h. :<br />
Oberhalb und unterhalb des Medians liegen gleichviele<br />
Merkmalswerte.<br />
Es gilt für den Median XZ :<br />
X = X<br />
Z n+<br />
1<br />
2<br />
X : x , x , x , ... ,x<br />
1 2 3 n<br />
1 ⎛ ⎞<br />
X Z = ⋅ ⎜ xn + xn<br />
⎟ falls n geradzahlig ist.<br />
2 ⎝<br />
+ ⎠<br />
2 2 1<br />
falls n ungerade bzw.
Dr. Dietmar Hubrich Statistik I Seite 21<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
II. Klassierter Fall<br />
Median (Zentralwert) II<br />
Bei klassierten Merkmalen wird der Median approximativ mit Hilfe<br />
der Verteilungsfunktion Fi bestimmt.<br />
Der Merkmalswert, bei dem die Verteilungsfunktion den<br />
Wert 0,5 annimmt, bezeichnet den Median<br />
X Z → (F(X Z) = 0,5). oder<br />
Der Median bezeichnet den Wert, bei dem die Fläche des<br />
Histogramms genau halbiert wird.<br />
III. Merkregeln zum Median :<br />
♦ Die Berechnung des Medians setzt voraus, dass die Merkmalswerte<br />
ordenbar sind. Er kann deshalb auch für Rangmerkmale,<br />
jedoch nicht für nominalskalierte Merkmale berechnet<br />
werden.<br />
♦ Extremwerte haben keinen Einfluss auf die Höhe des Medians.<br />
Der Wert XZ ist nur abhängig von der Größe des in der Mitte der<br />
Reihe liegenden Merkmalswertes.<br />
♦ Die Summe der absoluten Abweichungen der Merkmalswerte<br />
vom Median ist minimal.<br />
n<br />
∑<br />
i=<br />
1<br />
x − x =<br />
i Z<br />
min !<br />
D.h. Die Summe der absoluten Abweichungen von jedem<br />
anderen Merkmalswert ist größer.<br />
♦ Die Berechnung des Medians einer zusammengefassten<br />
Grundgesamtheit aus den Zentralwerten der <strong>Teil</strong>gesamtheiten<br />
ist nicht möglich.
Dr. Dietmar Hubrich Statistik I Seite 22<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
F(x)<br />
1<br />
0,9<br />
0,8<br />
0,7<br />
0,6<br />
0,5<br />
0,4<br />
0,3<br />
0,2<br />
0,1<br />
0<br />
0,84<br />
F4-F3<br />
0,439<br />
0,5-F3<br />
x<br />
Empirische Verteilungsfunktion und Median<br />
d<br />
Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />
0 - u. 4800 824 0,086 17,9 0,086<br />
4800 - u. 9600 549 0,057 11,9 0,143<br />
9600 - u. 16000 2839 0,296 46,3 0,439<br />
16000 - u. 25000 3908 0,408 45,3 0,847<br />
25000 - u. 50000 1370 0,143 5,7 0,990<br />
50000 - 100000 100 0,010 0,2 1,000<br />
Σ 9590 1,000 ./. ./.<br />
0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000<br />
16000 25000<br />
Einkommen in EUR<br />
F(x)
Dr. Dietmar Hubrich Statistik I Seite 23<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Beispiel I :<br />
Lösungen zur Berechnung des Medians<br />
männlich : xZ = 3200 EUR<br />
weiblich : xZ = 1960 EUR<br />
männ. + weib. : xZ = ½*(2500+3200) = 2850 EUR<br />
Beispiel II :<br />
männlich : ( 25000 16000) X Z = −<br />
0 061<br />
⋅ +<br />
0 408 16000<br />
,<br />
,<br />
X = Z<br />
0, 173<br />
12000 −7200 ⋅ + 7200<br />
0, 308<br />
X = Z<br />
0, 257<br />
16000 −9600 ⋅ + 9600<br />
0, 285<br />
weiblich : ( )<br />
männ. + weib. : ( )<br />
xZ = 17345,59 EUR<br />
xZ = 9896,10 EUR<br />
xD = 15371,23 EUR<br />
Die Berechnung von XZ erfolgt approximativ. Man gehe nach<br />
folgendem Lösungsmuster vor:<br />
(1) Bestimmung der medianen Klasse i. Die mediane Klasse ist die<br />
Klasse, bei der der Wert 0,5 der Verteilungsfunktion erstmalig<br />
überschritten wird. Dort gilt:<br />
Fi− 1 < 05 , ≤ Fi D.h. Der mittlere Wert liegt in der medianen Klasse.<br />
(2) Man nimmt an, dass in der Klasse i die Werte gleichmäßig über<br />
die gesamte Klassenbreite verteilt sind.<br />
(3) Der Anteil der Werte, die in die Klasse i fallen und für die<br />
Fi < 0,5 gilt, an der Gesamtzahl aller Werte der Klasse i beträgt.<br />
(4) Der Median<br />
berechnet sich :<br />
α i<br />
=<br />
−<br />
F − F<br />
05 , Fi<br />
−1<br />
i i−1<br />
u<br />
XZ = di⋅ α i + ei<br />
u<br />
mit ei<br />
= Unterschranke der Klasse i<br />
d i<br />
= Klassenbreite der Klasse i
Dr. Dietmar Hubrich Statistik I Seite 24<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
I. Diskreter Fall<br />
Arithmetisches Mittel I<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />
Ordnung nach ihrer Größe ist nicht notwendig.<br />
X : x , x , x ,<br />
1 2 3<br />
... ,x n (ungeordnet)<br />
Als arithmetisches Mittel bezeichnet man die Größe:<br />
x<br />
n 1<br />
= ⋅<br />
n i=<br />
x i<br />
1<br />
Bei der Berechnung von x werden alle Merkmalswerte xi<br />
verwendet. Die gesamte Information der statistischen Masse wird<br />
zur Berechnung von x benötigt.<br />
II. Klassierter Fall (bekannte teilarithmetische Mittel)<br />
Bei klassierten Merkmalen kann x exakt berechnet werden, wenn<br />
die arithmetischen Mittel der Klassen (teilarithmetische Mittel), die<br />
mit xi bezeichnet werden, bekannt sind.<br />
x ist dann das „gewogene arithmetische Mittel“ der xi , gewogen<br />
mit den absoluten Häufigkeiten hi.<br />
x =<br />
k<br />
∑<br />
h ⋅ x<br />
h<br />
Sind die teilarithmetischen Mittel nicht bekannt, so lässt sich<br />
x näherungsweise berechnen.<br />
∑<br />
k<br />
k<br />
k<br />
1<br />
h i<br />
= ⋅∑h ⋅ x = ∑ ⋅ x = ∑f<br />
⋅x<br />
n i=<br />
1 i=<br />
1 n i=<br />
1<br />
i i<br />
i=<br />
1<br />
k i i<br />
∑<br />
i=<br />
1<br />
i<br />
i i i
Dr. Dietmar Hubrich Statistik I Seite 25<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Arithmetisches Mittel II<br />
III. Klassierter Fall (unbekannte teilarithmetische Mittel)<br />
Sind die x i nicht bekannt, so kann das arithmetische Mittel<br />
näherungsweise berechnet werden. Anstelle der x i verwendet<br />
* *<br />
man die Klassenmitte x i . Die Klassenmitte x i entspricht dem<br />
arithmetischen Mittel der Unter- und Oberschranke der Klasse i.<br />
* 1<br />
xi = ⋅ ei + e<br />
2<br />
Für x gilt dann näherungsweise:<br />
Für das exakt berechnete x gilt:<br />
x<br />
≈<br />
u o ( i )<br />
k<br />
*<br />
hi⋅xi k<br />
i=<br />
1<br />
*<br />
= f x<br />
k ∑ ⋅ i i<br />
i=<br />
1<br />
∑ h i<br />
i=<br />
1<br />
∑<br />
♦ Die Summe der Abweichungen von x ist 0. Beweis :<br />
n<br />
( )<br />
n<br />
∑ xi − x = ∑ xi − nx = n x− nx = 0 q.e.d<br />
i=<br />
1<br />
i=<br />
1<br />
♦ Die Summe der Abweichungsquadrate von x ist minimal.<br />
n<br />
∑ ( xix) i=<br />
1<br />
2<br />
− = min !<br />
♦ Das arithmetische Mittel einer zusammengefassten Grundgesamtheit<br />
errechnet sich aus den gewogenen Mittelwerten der<br />
<strong>Teil</strong>gesamtheiten. Als Gewichte dienen die Besetzungszahlen<br />
der <strong>Teil</strong>gesamtheiten.<br />
♦ Die Berechnung von x ist nur bei quantitativen Merkmalen<br />
sinnvoll.<br />
♦ x ist immer dann ein adäquater Mittelwert, wenn die Ersatzwerteigenschaft<br />
betont wird.
Dr. Dietmar Hubrich Statistik I Seite 26<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Lösungen zur Berechnung des Arithmetischen Mittels<br />
Beispiel I :<br />
männlich : x = 3200, 91 EUR<br />
weiblich : x = 2122,86 EUR<br />
männ. + weib. : 11⋅ 3200,91 + 7⋅ 2122, 86<br />
x =<br />
11+ 7<br />
Beispiel II :<br />
= 2781, 67 EUR<br />
Die xi sind nicht bekannt. Aus diesem Grund werden die<br />
*<br />
Klassenmitten x herangezogen.<br />
i<br />
Männlich :<br />
Klasse Klassenmitte hi hixi *<br />
1 2400 824 1977600<br />
2 7200 549 3952800<br />
3 12800 2839 36339200<br />
4 20500 3908 80114000<br />
5 37500 1370 51375000<br />
6 75000 100 7500000<br />
Gesamt -- 9590 181258600<br />
x = 18900,79<br />
Weiblich :<br />
Klasse Klassenmitte hi hixi *<br />
1 1200 426 511200<br />
2 3600 358 1288800<br />
3 6000 517 3102000<br />
4 9600 1219 11702400<br />
5 18500 1327 24549500<br />
6 62500 116 7250000<br />
Gesamt -- 3963 48403900<br />
x = 12213,95<br />
9590⋅ 18900, 79 + 3963⋅12213, 95<br />
Männl. + Weibl. : x =<br />
= 16945, 51 EUR<br />
9590 + 3963
Dr. Dietmar Hubrich Statistik I Seite 27<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Geometrisches Mittel I<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />
Ordnung nach ihrer Größe ist nicht notwendig.<br />
Als geometrisches Mittel bezeichnet man die Größe:<br />
bzw. wenn man logarithmiert :<br />
Der Logarithmus des geometrischen Mittels ist gleich dem<br />
arithmetischen Mittel der Logarithmen der einzelnen<br />
Merkmalswerte X i.<br />
Das geometrische Mittel erweist sich als sinnvoller<br />
Mittelwert, wenn der Durchschnitt relativer Größen<br />
berechnet werden soll.<br />
Insbesondere bei der Berechnung der durchschnittlichen,<br />
periodischen Wachstumsrate von Zeitreihen ist das geometrische<br />
Mittel zu bestimmen.<br />
Beispiel :<br />
X : x , x , x ,<br />
1 2 3<br />
n x = x ⋅x ⋅ ⋅x<br />
... ,x n (ungeordnet)<br />
g 1 2 ... n<br />
n<br />
1<br />
log x = ⋅ ∑ log x<br />
= 1<br />
g i<br />
n i<br />
Jahr Kapital Zins Wachstumsfaktor<br />
0 100,0 -- --<br />
1 110,0 10,00 % 1,1000<br />
2 115,5 5,00 % 1,0500<br />
3 121,0 4,76 % 1,0476<br />
4 135,5 12,00 % 1,1200
Dr. Dietmar Hubrich Statistik I Seite 28<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Geometrisches Mittel II<br />
Berechnung der durchschnittlichen, jährlichen Verzinsung:<br />
Der Wert xg entspricht dem durchschnittlichen, jährlichen<br />
Wachstumsfaktor. Multipliziert man den Anfangswert des Kapitals<br />
(100,0) n mal mit xg erhält man den Endwert des Kapitals (135,5).<br />
Beachte:<br />
4 4<br />
x g = 11 , ⋅1, 05⋅1, 0476 ⋅ 112 , = 1, 355 = 1, 07894<br />
Die Größe n im Wurzelausdruck ist nicht gleich der Anzahl der<br />
absoluten Daten (5). Vielmehr bedeutet n hier die Anzahl der<br />
Wachstumsfaktoren.<br />
Berechnet wird n über:<br />
n = N −1 mit N = Anzahl der absoluten Werte<br />
Definition des Wachstumsfaktors F :<br />
yt<br />
yt = F⋅yt−1→ F = F = Wachstumsfaktor<br />
y<br />
Definition der Wachstumsrate g :<br />
Die Wachstumsrate g ergibt sich aus:<br />
Die durchschnittl. Wachstumsrate ist:<br />
Im Beispiel wurde das Kapital durchschnittlich mit xg = 1,07894<br />
verzinst. Dies entspricht einer durchschnittlichen Wachstumsrate<br />
von g = 7, 894 %.<br />
⎡ Endwert ⎤<br />
Alternative Berechnung : g = n ⎢<br />
− ⎥<br />
⎣ Anfangswert ⎦<br />
⋅ 1 100 %<br />
t−1<br />
[ ]<br />
g = F−1<br />
⋅100<br />
%<br />
[ ]<br />
g = xg−1 ⋅100<br />
%
Dr. Dietmar Hubrich Statistik I Seite 29<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Spannweite :<br />
Spannweite<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />
nach ihrer Größe geordnet.<br />
Dabei bedeutet:<br />
x<br />
1<br />
x<br />
i<br />
x<br />
n<br />
→<br />
→<br />
→<br />
X : x , x , x , ... , x<br />
1 2 3 n<br />
der kleinste Merkmalswert<br />
der i.te Merkmalswert der geordneten Reihe<br />
der größte Merkmalswert<br />
Die Differenz zwischen dem größten und dem kleinsten<br />
Merkmalswert bezeichnet die Spannweite R.<br />
R = x − x = x − x<br />
max min n 1<br />
Bei klassierten Merkmalen errechnet sich die Spannweite aus der<br />
Differenz zwischen Oberschranke der Klasse k und Unterschranke<br />
der 1. Klasse (Klasse i = 1 ... k).<br />
o u<br />
R = ek−e1 ♦ Die Spannweite ist nur ein grobes Maß zur Bestimmung der<br />
Streuung einer Verteilung.<br />
♦ „Ausreißer“ beeinflussen in hohem Maße ihren Wert.
Dr. Dietmar Hubrich Statistik I Seite 30<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Quartilsabweichung<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />
nach ihrer Größe geordnet.<br />
X : x , x , x ,<br />
1 2 3<br />
... ,x n<br />
Für den Median gilt bekanntlich: F(xZ) = 0,5.<br />
Hieraus folgt für die Quartilsabweichung QA:<br />
Die Quartilsabweichung gibt die durchschnittliche Streuung<br />
von 50 % der Merkmalswerte um den Median x Z an.<br />
Gesucht werden zwei Werte für die gelten soll:<br />
u<br />
Fx ( ) = 025 ,<br />
o<br />
Fx ( ) = 075 ,<br />
Zwischen den beiden Werten liegen definitionsgemäß 50 % allen<br />
erhobenen Merkmalswerts.<br />
Die Quartilsabweichung ist definiert als die mittlere Streubreite der<br />
beiden Quartile.<br />
o<br />
u<br />
[ ( Z) ( Z ) ]<br />
1<br />
QA =<br />
2<br />
x − x + x −x<br />
1 o u<br />
QA = ⋅( x −x)<br />
2
Dr. Dietmar Hubrich Statistik I Seite 31<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Lösungen zur Quartilsabweichung (Beispiel I, Männer)<br />
Ordnen der gegebenen Werte :<br />
1650 2030 2030 3200 3200 3200 3200 3700 4100 4100 4800<br />
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11<br />
Bestimmung von x u und x o :<br />
Allgemein : Reihe in 2 gleich große Hälften aufteilen<br />
(a) bei ungeradem n xZ = xn+1<br />
2<br />
(b) Bei geradem n Re ihe 1 : x ... x<br />
1 n<br />
2<br />
Reihe<br />
2 : x ... x<br />
n n<br />
2 1 +<br />
xu : Median der <strong>Teil</strong>reihe 1 (gerades n = 6)<br />
u 1 ⎛<br />
x = ⋅ ⎜ xn 2 ⎝<br />
⎞ 1<br />
+ xn<br />
⎟ = ⋅ ( 2030 + 3200) = 2615 EUR<br />
+ ⎠ 2<br />
2 2 1<br />
xo : Median der <strong>Teil</strong>reihe 2 (gerades n = 6)<br />
o 1 ⎛<br />
x = ⋅ ⎜ xn 2 ⎝<br />
⎞ 1<br />
+ xn<br />
⎟ = ⋅ ( 3700 + 4100) = 3900 EUR<br />
+ ⎠ 2<br />
QA :<br />
1<br />
2<br />
Interpretation :<br />
2 2 1<br />
Median<br />
o u 1<br />
⋅( x − x ) = ⋅( 3900 − 2615) = 642, 5 EUR<br />
2<br />
xZ gehört zu<br />
beiden<br />
Reihen.<br />
50% der Einkommen der männlichen Arbeitnehmer werden in<br />
einem Abstand von ± 642,50 EUR um den Median im Durchschnitt<br />
angetroffen.
Dr. Dietmar Hubrich Statistik I Seite 32<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Lösungen zur Quartilsabweichung (Beispiel II, Männer)<br />
1. Schritt :<br />
Bestimmung der Quartilsklassen i u und i o. (Klassen in denen F(x)<br />
erstmals 25% bzw. 75% überschreitet.)<br />
Quartilsklasse i u = 3 : 9600 - 16000 EUR<br />
Quartilsklasse i o = 4 : 16000 - 25000 EUR<br />
2. Schritt :<br />
Bestimmung von x u.<br />
x<br />
u<br />
= d<br />
3<br />
⋅α<br />
+ e<br />
0,<br />
25 − F<br />
α 3 =<br />
F − F<br />
x<br />
u<br />
3<br />
3<br />
2<br />
2<br />
u<br />
3<br />
=<br />
mit<br />
0,<br />
25<br />
= 6400⋅<br />
0,<br />
361+<br />
9600 = 11910,<br />
40 EUR<br />
3. Schritt :<br />
d<br />
0,<br />
439<br />
Bestimmung von x o.<br />
x<br />
o<br />
= d<br />
4<br />
⋅α<br />
+ e<br />
0,<br />
75 − F3<br />
α 4 =<br />
F − F<br />
x<br />
o<br />
4<br />
4<br />
3<br />
u<br />
4<br />
=<br />
mit<br />
0,<br />
75<br />
0,<br />
847<br />
3<br />
= 16000 − 9600 = 6400<br />
− 0,<br />
143<br />
=<br />
− 0,<br />
143<br />
d<br />
4<br />
0,<br />
361<br />
= 25000 −16000<br />
= 9000<br />
− 0,<br />
439<br />
=<br />
− 0,<br />
439<br />
0,<br />
762<br />
= 9000⋅<br />
0,<br />
762 + 16000 = 22860,<br />
29 EUR<br />
4. Schritt :<br />
1<br />
2<br />
und<br />
und<br />
e<br />
u<br />
3<br />
e<br />
= 9600<br />
u<br />
4<br />
= 16000<br />
Bestimmung von QA. QA = ⋅(<br />
22860,<br />
29 −11910,<br />
40)<br />
= 5474,<br />
95 EUR<br />
Interpretation :<br />
50% der männlichen Einkommen befinden sich im Durchschnitt in<br />
einem Abstand von ± 5474,95 EUR um den Median !
Dr. Dietmar Hubrich Statistik I Seite 33<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Varianz, Standardabweichung, Variationskoeffizient<br />
Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />
Ordnung nach ihrer Größe ist nicht notwendig.<br />
Die Varianz des Merkmals X ( = σ2 ) ist das arithmetische<br />
Mittel der Abstandsquadrate vom Mittelwert x .<br />
Es gilt der Zerlegungssatz. D.h. die Varianz lässt sich oft einfacher<br />
berechnen über:<br />
Die Quadratwurzel aus der Varianz heißt Standardabweichung<br />
σ x.<br />
Bei klassierten Merkmalen kann die Varianz nur sehr grob<br />
angenähert berechnet werden.<br />
2<br />
σ x<br />
≈<br />
k<br />
∑<br />
i=<br />
1<br />
* ( )<br />
h ⋅ x −x<br />
X : x 1<br />
2<br />
, x , x ,<br />
2 3<br />
( )<br />
... , x n (ungeordnet)<br />
1<br />
= ⋅ −<br />
n<br />
n<br />
∑ ( x x)<br />
2<br />
σ x i<br />
i=<br />
1<br />
n<br />
n<br />
2 1 2<br />
2 1 2<br />
σx = ⋅∑( xi −x) ⇔ σx<br />
= ⋅∑xi − x<br />
n i=<br />
1<br />
n i=<br />
1<br />
n<br />
n<br />
1 2<br />
1 2<br />
σx = ⋅∑( xi −x) ⇔ σx<br />
= ⋅∑xi − x<br />
n i=<br />
1<br />
n i=<br />
1<br />
i i<br />
k<br />
∑ h i<br />
i=<br />
1<br />
k<br />
*<br />
2<br />
*<br />
= ∑fi⋅ x i − x mit x i<br />
i=<br />
1<br />
k<br />
*<br />
= Klassenmitten, x = ∑fi⋅xi<br />
i=1<br />
Der Variationskoeffizient V beschreibt die Streuung relativ<br />
zur Höhe des Mittelwertes.<br />
x V =<br />
x<br />
σ<br />
2<br />
2<br />
2
Dr. Dietmar Hubrich Statistik I Seite 34<br />
Fachhochschule der Modulteil G1-3.2<br />
Deutschen Bundesbank <strong>Teil</strong> 1<br />
Lösung zu Varianz, Standardabweichung,<br />
Variationskoeffizient im Beispiel I<br />
lfd. Nr. i xi (weiblich) xi 2 (weiblich) xi (männl.) xi 2 (männl.)<br />
1 1710 2924100 1650 2722500<br />
2 1960 3841600 2030 4120900<br />
3 2500 6250000 4800 23040000<br />
4 1480 2190400 3200 10240000<br />
5 1710 2924100 3700 13690000<br />
6 2300 5290000 4100 16810000<br />
7 3200 10240000 3200 10240000<br />
8 -- -- 2030 4120900<br />
9 -- -- 3200 10240000<br />
10 -- -- 4100 16810000<br />
11 -- -- 3200 10240000<br />
Σ 14860 33660200 35210 122274300<br />
weiblich : männlich :<br />
14860<br />
x = = 2122, 86<br />
7<br />
33660200<br />
σ x = −2122,<br />
86<br />
7<br />
2<br />
σ = 302077, 5<br />
σ<br />
2 2<br />
x<br />
x<br />
= 302077, 5 = 549, 62<br />
Variationskoeffizient :<br />
weiblich : männlich :<br />
35210<br />
x = = 3200, 91<br />
11<br />
122274300<br />
σ x = −3200,<br />
91<br />
11<br />
2<br />
σ = 870020, 62<br />
2 2<br />
σ x<br />
V =<br />
x<br />
549, 62<br />
σ x<br />
= = 026 ,<br />
V =<br />
2122, 86<br />
x<br />
932, 75<br />
= = 029 ,<br />
3200, 91<br />
V = 0,26 < V = 0,29<br />
σ<br />
x<br />
x<br />
= 870020, 62 = 932, 75