06.10.2013 Aufrufe

Teil 1

Teil 1

Teil 1

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Vorlesungsskript<br />

Statistik<br />

Grundstudium<br />

Modul G1-3.2 Statistik I<br />

<strong>Teil</strong> 1<br />

Fachhochschule<br />

der<br />

Deutschen Bundesbank<br />

Dr. Dietmar Hubrich


Dr. Dietmar Hubrich Statistik I Seite 2<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

G1-3.2 Statistik I (<strong>Teil</strong> 1)<br />

1 Aufgaben und Ziele der Statistik<br />

2 Träger der Statistik und Grundbegriffe<br />

2.1 Amtliche und nichtamtliche Statistik<br />

2.2 Statistische Einheiten und statistische Massen<br />

2.3 Merkmale, Merkmalsträger und Metrik<br />

3 Formen und Arten der Datenerhebung<br />

4 Aufbereitung des Datenmaterials<br />

4.1 Reihen und Häufigkeiten<br />

4.2 Empirische und theoretische Verteilungen<br />

4.3 Grafische Darstellungen<br />

5 Mittelwerte und Streuungsmaße<br />

5.1 Lageparameter<br />

5.1.1 Modalwert (dichtester Wert)<br />

5.1.2 Median (Zentralwert)<br />

5.1.3 Arithmetisches Mittel<br />

5.1.4 Geometrisches Mittel<br />

5.2 Streuungsparameter<br />

5.2.1 Spannweite (Streubreite)<br />

5.2.2 Quartilsabweichung<br />

5.2.3 Varianz, Standardabweichung und Variationskoeffizient<br />

Literatur: Fahrmeier, L.; Künstler, R.; Pigeot, I.; Tutz, G. „Statistik“ – Der Weg zur<br />

Datenanalyse –, Springer Verlag 7. Aufl.<br />

Schulze, P.- M. „Beschreibende Statistik“, Oldenbourg Verlag,“<br />

Bourier, G. „Beschreibende Statistik - Praxisorientierte Einführung<br />

mit Aufgaben und Lösungen -“, Gabler Verlag 5. Aufl.<br />

sowie jedes andere Lehrbuch der Statistik


Dr. Dietmar Hubrich Statistik I Seite 3<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Methoden der Wissensermittlung<br />

Naturwissenschaft<br />

Beobachtung der Umwelt<br />

Erklärungsversuch des Phänomens<br />

durch „Hypothese“<br />

Experiment falsifiziert<br />

verifiziert<br />

„Theorie“<br />

(bleibt bestehen bis Gegenbeispiel<br />

gefunden wird)<br />

wenn lange Zeit nicht falsifiziert<br />

„Gesetz“<br />

Konsequenzen für die Statistik :<br />

Sozialwissenschaft<br />

Beobachtung der Umwelt<br />

Erklärungsversuch des Phänomens<br />

durch „Hypothese“<br />

Test der „Hypothese“ fast<br />

ausschließlich an Modellen.<br />

Experiment eher die Ausnahme<br />

verifiziert ? falsifiziert<br />

wegen Zeitvarianz und Raumvarianz<br />

der Hypothesen hat die Theorie nur<br />

begrenzte Gültigkeit.<br />

Wenn lange Zeit nicht falsifiziert<br />

„Quasi-Gesetz“<br />

♦ Prozess der Falsifizierung erfolgt viel öfter in den Sozialwissenschaften als in<br />

den Naturwissenschaften.<br />

♦ Ständiger Bedarf an neuen Hypothesen, die getestet werden müssen.<br />

♦ Sehr hoher Informationsbedarf.<br />

♦ Datenangebot immer wesentlich kleiner als Datennachfrage.<br />

Wenn : Datenangebot


Dr. Dietmar Hubrich Statistik I Seite 4<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Arbeitsweise des Statistischen Bundesamtes<br />

Gemäß §2 des Gesetzes über die Statistik für Bundeszwecke besteht<br />

die Aufgabe des Statistischen Bundesamtes in:<br />

⇒ Statistiken für Bundeszwecke technisch und methodisch<br />

vorzubereiten<br />

⇒ Die Ergebnisse für den Bund zu sammeln, zu erheben und<br />

aufzubereiten<br />

⇒ Volkswirtschaftliche Gesamtrechnungen aufzustellen<br />

⇒ Statistiken des Auslands zu sammeln und darzustellen<br />

Zu diesem Zweck veröffentlicht das Amt:<br />

⇒ Statistisches Jahrbuch für die Bundesrepublik Deutschland<br />

⇒ Monatszeitschrift „Wirtschaft und Statistik“<br />

⇒ Fachserien<br />

Die Aufgaben der Statistischen Landesämter umfassen:<br />

⇒ Erhebungen bei den einzelnen Merkmalsträgern<br />

⇒ Kumulierung der Ergebnisse zu Landesergebnissen<br />

⇒ Bereitstellung des Landesergebnisses zur Ermittlung des<br />

Bundesergebnisses.<br />

⇒ Vereinheitlichung aller Abgrenzungen hinsichtlich des<br />

Berichtskreises und der erhobenen Merkmale


Dr. Dietmar Hubrich Statistik I Seite 5<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Statistische Einheit und Statistische Masse<br />

Begriff : Statistische Einheit<br />

Die statistische Einheit ist das Einzelobjekt der statistischen<br />

Untersuchung. Sie ist der Träger der bei der Untersuchung<br />

interessierenden Information.<br />

Jede statistische Einheit muss<br />

Identifikationskriterien<br />

der statistischen<br />

♦ sachlich<br />

♦ räumlich<br />

Einheit<br />

♦ zeitlich eindeutig identifizierbar bzw.<br />

abgrenzbar sein.<br />

Begriff : Statistische Masse<br />

Die statistische Masse ist die Gesamtheit (Menge) von<br />

statistischen Einheiten mit übereinstimmenden<br />

Identifikationsmerkmalen.<br />

Alle Einheiten einer statistischen Masse sind sachlich, räumlich<br />

und zeitlich gleich abgegrenzt.<br />

Begriff : Strukturbruch<br />

Verändern sich die Identifikationsmerkmale der statistischen<br />

Einheiten einer statistischen Masse, so bezeichnet man dieses<br />

Phänomen als Strukturbruch.<br />

Beispiel : Volkszählung in der Bundesrepublik Deutschland:<br />

sachlich : jede lebende menschliche Person<br />

räumlich : Angabe des Gebietes, hier BRD<br />

zeitlich : Angabe eines Stichtages, z.B. 1.5.2011


Dr. Dietmar Hubrich Statistik I Seite 6<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriff : Bestandsmasse<br />

Bestands- und Ereignismassen<br />

Bestandsmassen sind statistische Massen, deren Einheiten eine<br />

gewisse Lebensdauer in der Zeit aufweisen. Die Erfassung von<br />

Bestandsmassen kann und muss deswegen stichtagsbezogen<br />

erfolgen.<br />

Beispiel : Weinvorrat im Keller<br />

1.1.2011 → 12 Flaschen<br />

1.2.2011 → 8 Flaschen<br />

1.3.2011 → 10 Flaschen<br />

Problem : Stichtagsunabhängigkeit<br />

durchschnittlicher<br />

Bestand für das<br />

I. Quartal →<br />

12 + 8 + 10<br />

= 10 Flaschen<br />

3<br />

Um Bestände auch stichtagsunabhängig angeben zu können,<br />

ist es sinnvoll, eine Bestandsmasse über einen Zeitraum hinweg<br />

durch ihren Durchschnittsbestand zu definieren.<br />

Begriff : Ereignismasse<br />

Ereignismassen sind statistische Massen, deren Einheiten zu<br />

ganz bestimmten Zeitpunkten auftreten, die im Zeitablauf zum<br />

Gesamtergebnis kumulieren. Die Erfassung von Ereignismassen<br />

kann und muss deswegen zeitraumbezogen erfolgen.<br />

Beispiel : Demoskopische Daten<br />

Geburten im Laufe des Jahres alle Einzelergebnisse<br />

Todesfälle im Laufe des Jahres des Jahres werden<br />

Zuwanderung im Laufe des Jahres kumuliert.


Dr. Dietmar Hubrich Statistik I Seite 7<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriff : Merkmal<br />

Merkmale und Merkmalsträger I<br />

Die Eigenschaften einer statistischen Einheit, die für die<br />

statistische Untersuchung relevant sind, heißen statistische<br />

Merkmale.<br />

Begriff : Merkmalsträger<br />

Träger der Merkmale, als Besitzer bestimmter interessierender<br />

Eigenschaften, sind immer die statistischen Einheiten selbst.<br />

Begriff : Merkmalsausprägung<br />

Alle möglichen Zustände, die ein Merkmal annehmen kann,<br />

heißen Merkmalsausprägungen. Sie können vorkommen als:<br />

abzählbare oder diskrete ↔ nicht-abzählbare oder stetige<br />

Merkmalsausprägungen.<br />

Beispiele :<br />

Noten in einer Klausur.<br />

Geschlecht einer Person.<br />

Begriff : Merkmalswerte<br />

Körpergewicht von Personen.<br />

Einkommen von Familien.<br />

Derjenige Wert, den ein Merkmal von allen möglichen<br />

Merkmalsausprägungen tatsächlich annimmt, heißt<br />

Merkmalswert.<br />

Er ist das eigentliche Datum, der Träger der Information, der in<br />

einer statistischen Analyse verarbeitet wird.<br />

Beispiel :<br />

Merkmalsausprägung → Noten ; Merkmalswert → sehr gut


Dr. Dietmar Hubrich Statistik I Seite 8<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Merkmale und Merkmalsträger II<br />

Merkmalswerten, Merkmalsausprägungen oder Merkmalen<br />

können zwei großen Klassifizierungen zugeordnet werden:<br />

Begriff : Quantitative Merkmale<br />

Quantitative Merkmale sind Merkmale, denen Zahlen<br />

zugeordnet werden können und die durch diese Zahlen<br />

vollständig beschreibbar sind.<br />

Dies bedeutet insbesondere:<br />

♦ Quantitative Merkmale besitzen stets eine Dimension.<br />

♦ Es können Abstände angegeben werden.<br />

♦ Die Messvorschrift ist stets eine kardinale Messmetrik.<br />

♦ Schlüsselzahlen sind keine quantitativen Merkmale.<br />

Begriff : Qualitative Merkmale<br />

Qualitative Merkmale sind Merkmale, die nicht durch<br />

dimensionsbehaftete Zahlen beschreibbar sind. Voneinander<br />

unterscheidbar werden sie nur durch ihre Beschaffenheit oder<br />

Bedeutung.<br />

Dies bedeutet insbesondere:<br />

♦ Schlüsselzahlen sind qualitative Merkmale.<br />

♦ Es können keine Differenzen berechnet werden.<br />

♦ Qualitative Merkmale sind dimensionslos.<br />

♦ Die Messvorschrift ist eine nominale oder ordinale<br />

Messmetrik.<br />

Problem :<br />

Sind qualitative oder quantitative Merkmalsausprägungen stetig,<br />

so ist es nicht möglich einen exakten Merkmalswert zu erheben.<br />

In einem solchen Fall, wird man versuchen die Abzählbarkeit durch<br />

Bildung von Klassen zu ermöglichen.<br />

→ Klassierung von Daten


Dr. Dietmar Hubrich Statistik I Seite 9<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriff : nominale Metrik<br />

Messniveaus von Merkmalen I<br />

Die nominale Metrik ist eine Messvorschrift für Merkmalsausprägungen.<br />

Sie beschränkt sich auf die Untersuchung der<br />

Gleichheit oder Ungleichheit mit einem vorgegebenen oder<br />

erwarteten Erhebungsmerkmal.<br />

Dabei gilt insbesondere:<br />

♦ Nominale Metrik ist auch anwendbar auf qualitative<br />

Merkmale.<br />

♦ Nominale Metrik beruht auf dem Prinzip der vergleichenden<br />

Zuordnung.<br />

♦ Die Reihenfolge der Merkmalswerte ist beliebig. Es erfolgt<br />

keine Wertung.<br />

Begriff : ordinale Metrik<br />

Die ordinale Metrik ist eine Messvorschrift für bewertbare<br />

Merkmalsausprägungen. Auch hier steht die Gleichheit oder<br />

Ungleichheit mit einem vorgegebenen oder erwarteten Erhebungsmerkmal<br />

im Vordergrund.<br />

Dabei gilt insbesondere:<br />

♦ Ordinale Metrik ist auch anwendbar auf qualitative<br />

Merkmale.<br />

♦ Ordinale Metrik beruht ebenfalls auf dem Prinzip der<br />

vergleichenden Zuordnung.<br />

♦ Die Reihenfolge der Merkmalswerte ist nicht beliebig. Es<br />

erfolgt immer eine Einstufung in eine Rangskala.


Dr. Dietmar Hubrich Statistik I Seite 10<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriff : kardinale Metrik<br />

Messniveaus von Merkmalen II<br />

Die kardinale Metrik ist eine Messvorschrift für zahlenmäßig<br />

erklärbare Merkmalsausprägungen.<br />

Dabei gilt insbesondere:<br />

♦ Anwendung nur auf quantitative Merkmale.<br />

♦ Es können Abstände und Relationen gemessen werden.<br />

♦ Es können nur Merkmale erfasst werden, die eine Dimension<br />

besitzen.<br />

Vergleich der Messvorschriften:<br />

Messvorschrift Erfassbare Merkmale<br />

nominale Metrik qualitative und<br />

quantitative Daten<br />

ordinale Metrik ordenbar qualitative<br />

und quantitative<br />

Daten<br />

kardinale Metrik nur quantitative<br />

Daten<br />

Fazit des Vergleichs :<br />

Anforderung an das<br />

Datenmaterial<br />

schwächste Anforderung<br />

an die Messbarkeit eines<br />

Merkmals.<br />

mittlere Anforderung an<br />

die Messbarkeit eines<br />

Merkmals.<br />

höchste Anforderung an<br />

die Messbarkeit eines<br />

Merkmals.<br />

Die strengste Metrik, also die kardinale Metrik, beinhaltet die<br />

schwächste Metrik, also die nominale Metrik. Alles, was mit<br />

einer kardinalen Metrik gemessen werden kann, kann auch<br />

mit einer ordinalen oder nominalen Metrik gemessen werden.


Dr. Dietmar Hubrich Statistik I Seite 11<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriffe :<br />

Urliste<br />

Ungeordnete<br />

Statistische<br />

Reihe<br />

Ordnungskriterien<br />

der<br />

geordneten<br />

statistischen<br />

Reihe<br />

Besetzungszahl<br />

Absolute<br />

Häufigkeit der<br />

Klasse i<br />

Bei k-Klassen<br />

gilt:<br />

Relative<br />

Häufigkeit der<br />

Klasse i<br />

Bei k-Klassen<br />

gilt:<br />

Reihen, Häufigkeiten und Verteilungen I<br />

Sammlung von Merkmalswerten einer Erhebung<br />

X : x1 , x2 , x3 ,..., xn<br />

n = Gesamtzahl der einbezogenen statistischen<br />

Einheiten.<br />

ordinal/kardinal → Größe der Zahl oder Rang<br />

nominal → sachliche Ordnung<br />

Zeitpunkt der<br />

Erhebung → Zeitreihen, Indexreihen, etc..<br />

Anzahl der Merkmalsträger pro Klasse<br />

Besetzungszahl der i.ten Klasse = hi<br />

k<br />

= ∑<br />

i=<br />

1<br />

n h i<br />

n = Gesamtzahl der einbezogenen statistischen<br />

Einheiten.<br />

hi<br />

fi<br />

=<br />

n<br />

fi = relative Häufigkeit der Klasse i<br />

k<br />

∑ fi =<br />

i=<br />

1<br />

1 oder 100 %


Dr. Dietmar Hubrich Statistik I Seite 12<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Begriffe:<br />

HäufigkeitstabelleHäufigkeitsverteilung<br />

Reihen, Häufigkeiten und Verteilungen II<br />

Tabellarische Darstellung der absoluten Häufigkeiten.<br />

Zusammenstellung der Merkmalswerte in Klassen mit<br />

zugehörigen absoluten/relativen Häufigkeiten.<br />

Beispiel : Soziale Stellung des Haushaltsvorstands (BRD, 1969)<br />

Klasse i<br />

Soziale<br />

Stellung<br />

xi<br />

Absolute<br />

Häufigkeit hi<br />

[in 100.000]<br />

Relative<br />

Häufigkeit fi<br />

Verteilungsfunktion<br />

F(xi)<br />

1 Landwirt 8 0,04 0,04<br />

2 Selbständig 16 0,07 0,11<br />

3 Beamter 12 0,06 0,17<br />

4 Angestellter 36 0,17 0,34<br />

5 Arbeiter 63 0,31 0,66<br />

6 Nicht Erwerbstätige<br />

71<br />

0,34<br />

1,00<br />

Σ: 206 1,00 ./.<br />

Begriff : Verteilungsfunktion<br />

Die Verteilungsfunktion F(x) für das Merkmal x ist die Funktion,<br />

die jedem Merkmalswert xi den Anteilswert aller statistischen<br />

Einheiten zuordnet, die einen Merkmalswert xi oder kleiner<br />

i h i<br />

j<br />

aufweisen: F( xi)=<br />

∑ = ∑fj<br />

j = 1,2,3,...,k<br />

j=<br />

1 n j=<br />

1<br />

(k ist die Anzahl der Klassen oder Häufungspunkte)


Dr. Dietmar Hubrich Statistik I Seite 13<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Empirische und theoretische Verteilungen<br />

Begriff : empirische Verteilungsfunktion<br />

Unter einer empirischen Verteilungsfunktion versteht man die<br />

Kumulierung der relativen Häufigkeiten von klassierten, real<br />

erhobenen Merkmalswerten.<br />

Beispiel : Schlagball - Weitwürfe von Schülern<br />

Klasse i Weite x in m Häufigkeit h i<br />

relative<br />

Häufigkeit f i<br />

Besetzungsdichte<br />

f i/d i<br />

Verteilungsfunktion<br />

F(x i)<br />

1 15


Dr. Dietmar Hubrich Statistik I Seite 14<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Beispielfragestellungen zu charakteristischen Kennziffern<br />

Beispiel I:<br />

In der Schlossbank betrugen die monatlichen Gehälter der männlichen und<br />

weiblichen Angestellten (in EUR):<br />

Männliche Arbeitnehmer :<br />

1650 , 2030 , 4800 , 3200 , 3700 , 4100 , 3200 , 2030 , 3200 , 4100 , 3200<br />

Weibliche Arbeitnehmer :<br />

1710 , 1960 , 2500 , 1480 , 1710 , 2300 , 3200<br />

Beispiel II:<br />

Im Konzern A betrugen die Einkommen der männlichen und weiblichen<br />

Arbeitnehmer (in EUR):<br />

Männliche Arbeitnehmer :<br />

Einkommen Arbeitnehmer<br />

X<br />

hi<br />

0 - u. 4800 824<br />

4800 - u. 9600 549<br />

9600 - u. 16000 2839<br />

16000 - u. 25000 3908<br />

25000 - u. 50000 1370<br />

50000 - 100000 100<br />

Gesamt 9590<br />

Weibliche Arbeitnehmer :<br />

Einkommen Arbeitnehmer<br />

X<br />

hi<br />

0 - u. 2400 426<br />

2400 - u. 4800 358<br />

4800 - u. 7200 517<br />

7200 - u. 12000 1219<br />

12000 - u. 25000 1327<br />

25000 - 100000 116<br />

Gesamt 3963<br />

Diese Beispiele dienen als<br />

Übungsstandard. Gemäß<br />

den vorkommenden<br />

Merkmalsarten<br />

klassiert, quantitativ bzw.<br />

diskret, quantitativ<br />

sind unterschiedliche<br />

Berechnungsmethoden zur<br />

Bestimmung der Lage- und<br />

Streuungsparameter<br />

anzuwenden.


Dr. Dietmar Hubrich Statistik I Seite 15<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Vollständige Häufigkeitstabelle zum Beispiel II<br />

Männliche Arbeitnehmer :<br />

Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />

0 - u. 4800 824 0,086 17,9 0,086<br />

4800 - u. 9600 549 0,057 11,9 0,143<br />

9600 - u. 16000 2839 0,296 46,3 0,439<br />

16000 - u. 25000 3908 0,408 45,3 0,847<br />

25000 - u. 50000 1370 0,143 5,7 0,990<br />

50000 - 100000 100 0,010 0,2 1,000<br />

Weibliche Arbeitnehmer :<br />

Σ 9590 1,000 ./. ./.<br />

Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />

0 - u. 2400 426 0,107 44,8 0,107<br />

2400 - u. 4800 358 0,090 37,6 0,197<br />

4800 - u. 7200 517 0,130 54,4 0,327<br />

7200 - u. 12000 1219 0,308 64,1 0,635<br />

12000 - u. 25000 1327 0,335 25,8 0,971<br />

25000 - 100000 116 0,029 0,4 1,000<br />

Σ 3963 1,000 ./. ./.


Dr. Dietmar Hubrich Statistik I Seite 16<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Besetzungsdichte fi/di *10^6<br />

Besetzungsdichte fi/di *10^6<br />

50<br />

40<br />

30<br />

20<br />

10<br />

Histogramme zum Beispiel II<br />

Histogramm : Männliche Arbeitnehmer (Beispiel 2)<br />

0<br />

0 20000 40000 60000 80000 100000 120000<br />

Einkommen in EUR<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

Histogramm : Weibliche Arbeitnehmer (Beispiel 2)<br />

0<br />

0 20000 40000 60000 80000 100000 120000<br />

Einkommen in EUR<br />

Die Histogramme lassen die Vermutung zu, dass die männlichen<br />

Arbeitnehmer des Konzerns A prinzipiell mehr verdienen als ihre<br />

Kolleginnen.<br />

Eine exakte Bestätigung dieser Vermutung lässt die Anschauung<br />

nicht zu. Hierfür ist es notwendig, Lage- bzw. Streuungsparameter<br />

zu berechnen.


Dr. Dietmar Hubrich Statistik I Seite 17<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Modalwert (Modus, häufigster Wert)<br />

Als Modalwert der Verteilung eines Merkmals bezeichnet man den<br />

Merkmalswert, der am häufigsten auftritt.<br />

(1) Bei qualitativen Merkmalen und bei diskreten quantitativen<br />

Merkmalen:<br />

Der Merkmalswert, für den die relative oder absolute<br />

Häufigkeit f i ihr Maximum erreicht, bezeichnet den<br />

Modalwert X D.<br />

(2) Bei stetigen quantitativen Merkmalen werden Klassen gebildet.<br />

Für klassierte Merkmale gilt:<br />

Die Klasse mit der größten Besetzungsdichte<br />

(Häufigkeitsdichte) heißt modale Klasse. Die<br />

Klassenmitte der modalen Klasse bezeichnet den<br />

Modalwert X D.<br />

♦ Der Modalwert hat nur dann einen Sinn, wenn die Verteilung<br />

eingipflig ist, also ein eindeutiges, globales Maximum besitzt.<br />

♦ Auch bei nominalskalierten Merkmalen ist der Modalwert ein<br />

sinnvoller Mittelwert.<br />

♦ Die Berechnung eines Modalwertes einer zusammengefassten<br />

Grundgesamtheit aus den Modalwerten der <strong>Teil</strong>gesamtheiten<br />

ist nicht möglich.


Dr. Dietmar Hubrich Statistik I Seite 18<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Beispiel I :<br />

Lösungen zur Berechnung des Modalwertes<br />

männlich : xD = 3200 EUR<br />

weiblich : xD = 1710 EUR<br />

männ. + weib. : xD = 3200 EUR<br />

Beispiel II :<br />

männlich : Modale Klasse :<br />

9600 - unter 16000<br />

weiblich : Modale Klasse :<br />

7200 - unter 12000<br />

männ. + weib. : Modale Klasse :<br />

9600 - unter 16000<br />

xD = 12800 EUR<br />

xD = 9600 EUR<br />

xD = 12800 EUR<br />

Zur Berechnung des Modalwertes Beispiel II (männ. + weib.) ist es<br />

notwendig eine neue gemeinsame Häufigkeitstabelle zu erstellen.<br />

Bei unterschiedlichen Klassenbreiten verwendet man dazu die<br />

Methode der Zuschlagsrechnung (Rechenschema s. nächste<br />

Seite). Die Intervallstruktur wird dabei von der <strong>Teil</strong>gesamtheit mit<br />

der größeren Anzahl an Merkmalsträgern übernommen.<br />

Die vollständige Häufigkeitstabelle hat dann folgendes Aussehen:<br />

Männliche + Weibliche Arbeitnehmer (Beispiel II) :<br />

Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />

0 - u. 4800 1608 0,119 24,7 0,119<br />

4800 - u. 9600 1675 0,124 25,7 0,243<br />

9600 - u. 16000 3857 0,285 44,4 0,528<br />

16000 - u. 25000 4827 0,356 39,6 0,884<br />

25000 - u. 50000 1409 0,104 4,1 0,988<br />

50000 - 100000 177 0,013 0,3 1,000<br />

Σ 13553 1,000 ./. ./.


Dr. Dietmar Hubrich Statistik I Seite 19<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Rechenschema zur Häufigkeitstabelle Beispiel II<br />

Die <strong>Teil</strong>gesamtheit der männlichen Arbeitnehmer besitzt die größte<br />

Anzahl an Merkmalsträgern. Diese Intervallstruktur ist Grundlage für<br />

die zusammengefasste Häufigkeitstabelle:<br />

Klasse<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

Intervall<br />

0 - u. 4800<br />

4800 - u. 9600<br />

9600 - u. 16000<br />

16000 - u. 25000<br />

25000 - u. 50000<br />

50000 - 100000<br />

Σ<br />

Häufigkeit<br />

824 + 426 + 358 = 1608<br />

1219<br />

549 + 517 +<br />

2<br />

= 1675<br />

609,5 wird auf 609 gerundet. (Rest 610)<br />

Zuschlag untere Klasse.<br />

16000 − 12000<br />

2839 + 610 +<br />

⋅ 1327<br />

13000<br />

= 3857<br />

→ + 408 (Rest 919)<br />

3908 + 919 = 4827<br />

1370<br />

+<br />

50000 − 25000<br />

⋅ 116<br />

75000<br />

= 1409<br />

→ + 39 (Rest 77)<br />

100 + 77 = 177<br />

13553


Dr. Dietmar Hubrich Statistik I Seite 20<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

I. Diskreter Fall<br />

Median (Zentralwert) I<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />

nach ihrer Größe geordnet.<br />

Dabei bedeutet:<br />

x<br />

1<br />

x<br />

i<br />

x<br />

n<br />

→<br />

→<br />

→<br />

der kleinste Merkmalswert<br />

der i.te Merkmalswert der geordneten Reihe<br />

der größte Merkmalswert<br />

Als Median der Verteilung eines Merkmals bezeichnet man den<br />

mittleren Merkmalswert der Reihe. D.h. :<br />

Oberhalb und unterhalb des Medians liegen gleichviele<br />

Merkmalswerte.<br />

Es gilt für den Median XZ :<br />

X = X<br />

Z n+<br />

1<br />

2<br />

X : x , x , x , ... ,x<br />

1 2 3 n<br />

1 ⎛ ⎞<br />

X Z = ⋅ ⎜ xn + xn<br />

⎟ falls n geradzahlig ist.<br />

2 ⎝<br />

+ ⎠<br />

2 2 1<br />

falls n ungerade bzw.


Dr. Dietmar Hubrich Statistik I Seite 21<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

II. Klassierter Fall<br />

Median (Zentralwert) II<br />

Bei klassierten Merkmalen wird der Median approximativ mit Hilfe<br />

der Verteilungsfunktion Fi bestimmt.<br />

Der Merkmalswert, bei dem die Verteilungsfunktion den<br />

Wert 0,5 annimmt, bezeichnet den Median<br />

X Z → (F(X Z) = 0,5). oder<br />

Der Median bezeichnet den Wert, bei dem die Fläche des<br />

Histogramms genau halbiert wird.<br />

III. Merkregeln zum Median :<br />

♦ Die Berechnung des Medians setzt voraus, dass die Merkmalswerte<br />

ordenbar sind. Er kann deshalb auch für Rangmerkmale,<br />

jedoch nicht für nominalskalierte Merkmale berechnet<br />

werden.<br />

♦ Extremwerte haben keinen Einfluss auf die Höhe des Medians.<br />

Der Wert XZ ist nur abhängig von der Größe des in der Mitte der<br />

Reihe liegenden Merkmalswertes.<br />

♦ Die Summe der absoluten Abweichungen der Merkmalswerte<br />

vom Median ist minimal.<br />

n<br />

∑<br />

i=<br />

1<br />

x − x =<br />

i Z<br />

min !<br />

D.h. Die Summe der absoluten Abweichungen von jedem<br />

anderen Merkmalswert ist größer.<br />

♦ Die Berechnung des Medians einer zusammengefassten<br />

Grundgesamtheit aus den Zentralwerten der <strong>Teil</strong>gesamtheiten<br />

ist nicht möglich.


Dr. Dietmar Hubrich Statistik I Seite 22<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

F(x)<br />

1<br />

0,9<br />

0,8<br />

0,7<br />

0,6<br />

0,5<br />

0,4<br />

0,3<br />

0,2<br />

0,1<br />

0<br />

0,84<br />

F4-F3<br />

0,439<br />

0,5-F3<br />

x<br />

Empirische Verteilungsfunktion und Median<br />

d<br />

Einkommen X [EUR] hi fi fi/di*10 6 Fi<br />

0 - u. 4800 824 0,086 17,9 0,086<br />

4800 - u. 9600 549 0,057 11,9 0,143<br />

9600 - u. 16000 2839 0,296 46,3 0,439<br />

16000 - u. 25000 3908 0,408 45,3 0,847<br />

25000 - u. 50000 1370 0,143 5,7 0,990<br />

50000 - 100000 100 0,010 0,2 1,000<br />

Σ 9590 1,000 ./. ./.<br />

0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000<br />

16000 25000<br />

Einkommen in EUR<br />

F(x)


Dr. Dietmar Hubrich Statistik I Seite 23<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Beispiel I :<br />

Lösungen zur Berechnung des Medians<br />

männlich : xZ = 3200 EUR<br />

weiblich : xZ = 1960 EUR<br />

männ. + weib. : xZ = ½*(2500+3200) = 2850 EUR<br />

Beispiel II :<br />

männlich : ( 25000 16000) X Z = −<br />

0 061<br />

⋅ +<br />

0 408 16000<br />

,<br />

,<br />

X = Z<br />

0, 173<br />

12000 −7200 ⋅ + 7200<br />

0, 308<br />

X = Z<br />

0, 257<br />

16000 −9600 ⋅ + 9600<br />

0, 285<br />

weiblich : ( )<br />

männ. + weib. : ( )<br />

xZ = 17345,59 EUR<br />

xZ = 9896,10 EUR<br />

xD = 15371,23 EUR<br />

Die Berechnung von XZ erfolgt approximativ. Man gehe nach<br />

folgendem Lösungsmuster vor:<br />

(1) Bestimmung der medianen Klasse i. Die mediane Klasse ist die<br />

Klasse, bei der der Wert 0,5 der Verteilungsfunktion erstmalig<br />

überschritten wird. Dort gilt:<br />

Fi− 1 < 05 , ≤ Fi D.h. Der mittlere Wert liegt in der medianen Klasse.<br />

(2) Man nimmt an, dass in der Klasse i die Werte gleichmäßig über<br />

die gesamte Klassenbreite verteilt sind.<br />

(3) Der Anteil der Werte, die in die Klasse i fallen und für die<br />

Fi < 0,5 gilt, an der Gesamtzahl aller Werte der Klasse i beträgt.<br />

(4) Der Median<br />

berechnet sich :<br />

α i<br />

=<br />

−<br />

F − F<br />

05 , Fi<br />

−1<br />

i i−1<br />

u<br />

XZ = di⋅ α i + ei<br />

u<br />

mit ei<br />

= Unterschranke der Klasse i<br />

d i<br />

= Klassenbreite der Klasse i


Dr. Dietmar Hubrich Statistik I Seite 24<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

I. Diskreter Fall<br />

Arithmetisches Mittel I<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />

Ordnung nach ihrer Größe ist nicht notwendig.<br />

X : x , x , x ,<br />

1 2 3<br />

... ,x n (ungeordnet)<br />

Als arithmetisches Mittel bezeichnet man die Größe:<br />

x<br />

n 1<br />

= ⋅<br />

n i=<br />

x i<br />

1<br />

Bei der Berechnung von x werden alle Merkmalswerte xi<br />

verwendet. Die gesamte Information der statistischen Masse wird<br />

zur Berechnung von x benötigt.<br />

II. Klassierter Fall (bekannte teilarithmetische Mittel)<br />

Bei klassierten Merkmalen kann x exakt berechnet werden, wenn<br />

die arithmetischen Mittel der Klassen (teilarithmetische Mittel), die<br />

mit xi bezeichnet werden, bekannt sind.<br />

x ist dann das „gewogene arithmetische Mittel“ der xi , gewogen<br />

mit den absoluten Häufigkeiten hi.<br />

x =<br />

k<br />

∑<br />

h ⋅ x<br />

h<br />

Sind die teilarithmetischen Mittel nicht bekannt, so lässt sich<br />

x näherungsweise berechnen.<br />

∑<br />

k<br />

k<br />

k<br />

1<br />

h i<br />

= ⋅∑h ⋅ x = ∑ ⋅ x = ∑f<br />

⋅x<br />

n i=<br />

1 i=<br />

1 n i=<br />

1<br />

i i<br />

i=<br />

1<br />

k i i<br />

∑<br />

i=<br />

1<br />

i<br />

i i i


Dr. Dietmar Hubrich Statistik I Seite 25<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Arithmetisches Mittel II<br />

III. Klassierter Fall (unbekannte teilarithmetische Mittel)<br />

Sind die x i nicht bekannt, so kann das arithmetische Mittel<br />

näherungsweise berechnet werden. Anstelle der x i verwendet<br />

* *<br />

man die Klassenmitte x i . Die Klassenmitte x i entspricht dem<br />

arithmetischen Mittel der Unter- und Oberschranke der Klasse i.<br />

* 1<br />

xi = ⋅ ei + e<br />

2<br />

Für x gilt dann näherungsweise:<br />

Für das exakt berechnete x gilt:<br />

x<br />

≈<br />

u o ( i )<br />

k<br />

*<br />

hi⋅xi k<br />

i=<br />

1<br />

*<br />

= f x<br />

k ∑ ⋅ i i<br />

i=<br />

1<br />

∑ h i<br />

i=<br />

1<br />

∑<br />

♦ Die Summe der Abweichungen von x ist 0. Beweis :<br />

n<br />

( )<br />

n<br />

∑ xi − x = ∑ xi − nx = n x− nx = 0 q.e.d<br />

i=<br />

1<br />

i=<br />

1<br />

♦ Die Summe der Abweichungsquadrate von x ist minimal.<br />

n<br />

∑ ( xix) i=<br />

1<br />

2<br />

− = min !<br />

♦ Das arithmetische Mittel einer zusammengefassten Grundgesamtheit<br />

errechnet sich aus den gewogenen Mittelwerten der<br />

<strong>Teil</strong>gesamtheiten. Als Gewichte dienen die Besetzungszahlen<br />

der <strong>Teil</strong>gesamtheiten.<br />

♦ Die Berechnung von x ist nur bei quantitativen Merkmalen<br />

sinnvoll.<br />

♦ x ist immer dann ein adäquater Mittelwert, wenn die Ersatzwerteigenschaft<br />

betont wird.


Dr. Dietmar Hubrich Statistik I Seite 26<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Lösungen zur Berechnung des Arithmetischen Mittels<br />

Beispiel I :<br />

männlich : x = 3200, 91 EUR<br />

weiblich : x = 2122,86 EUR<br />

männ. + weib. : 11⋅ 3200,91 + 7⋅ 2122, 86<br />

x =<br />

11+ 7<br />

Beispiel II :<br />

= 2781, 67 EUR<br />

Die xi sind nicht bekannt. Aus diesem Grund werden die<br />

*<br />

Klassenmitten x herangezogen.<br />

i<br />

Männlich :<br />

Klasse Klassenmitte hi hixi *<br />

1 2400 824 1977600<br />

2 7200 549 3952800<br />

3 12800 2839 36339200<br />

4 20500 3908 80114000<br />

5 37500 1370 51375000<br />

6 75000 100 7500000<br />

Gesamt -- 9590 181258600<br />

x = 18900,79<br />

Weiblich :<br />

Klasse Klassenmitte hi hixi *<br />

1 1200 426 511200<br />

2 3600 358 1288800<br />

3 6000 517 3102000<br />

4 9600 1219 11702400<br />

5 18500 1327 24549500<br />

6 62500 116 7250000<br />

Gesamt -- 3963 48403900<br />

x = 12213,95<br />

9590⋅ 18900, 79 + 3963⋅12213, 95<br />

Männl. + Weibl. : x =<br />

= 16945, 51 EUR<br />

9590 + 3963


Dr. Dietmar Hubrich Statistik I Seite 27<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Geometrisches Mittel I<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />

Ordnung nach ihrer Größe ist nicht notwendig.<br />

Als geometrisches Mittel bezeichnet man die Größe:<br />

bzw. wenn man logarithmiert :<br />

Der Logarithmus des geometrischen Mittels ist gleich dem<br />

arithmetischen Mittel der Logarithmen der einzelnen<br />

Merkmalswerte X i.<br />

Das geometrische Mittel erweist sich als sinnvoller<br />

Mittelwert, wenn der Durchschnitt relativer Größen<br />

berechnet werden soll.<br />

Insbesondere bei der Berechnung der durchschnittlichen,<br />

periodischen Wachstumsrate von Zeitreihen ist das geometrische<br />

Mittel zu bestimmen.<br />

Beispiel :<br />

X : x , x , x ,<br />

1 2 3<br />

n x = x ⋅x ⋅ ⋅x<br />

... ,x n (ungeordnet)<br />

g 1 2 ... n<br />

n<br />

1<br />

log x = ⋅ ∑ log x<br />

= 1<br />

g i<br />

n i<br />

Jahr Kapital Zins Wachstumsfaktor<br />

0 100,0 -- --<br />

1 110,0 10,00 % 1,1000<br />

2 115,5 5,00 % 1,0500<br />

3 121,0 4,76 % 1,0476<br />

4 135,5 12,00 % 1,1200


Dr. Dietmar Hubrich Statistik I Seite 28<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Geometrisches Mittel II<br />

Berechnung der durchschnittlichen, jährlichen Verzinsung:<br />

Der Wert xg entspricht dem durchschnittlichen, jährlichen<br />

Wachstumsfaktor. Multipliziert man den Anfangswert des Kapitals<br />

(100,0) n mal mit xg erhält man den Endwert des Kapitals (135,5).<br />

Beachte:<br />

4 4<br />

x g = 11 , ⋅1, 05⋅1, 0476 ⋅ 112 , = 1, 355 = 1, 07894<br />

Die Größe n im Wurzelausdruck ist nicht gleich der Anzahl der<br />

absoluten Daten (5). Vielmehr bedeutet n hier die Anzahl der<br />

Wachstumsfaktoren.<br />

Berechnet wird n über:<br />

n = N −1 mit N = Anzahl der absoluten Werte<br />

Definition des Wachstumsfaktors F :<br />

yt<br />

yt = F⋅yt−1→ F = F = Wachstumsfaktor<br />

y<br />

Definition der Wachstumsrate g :<br />

Die Wachstumsrate g ergibt sich aus:<br />

Die durchschnittl. Wachstumsrate ist:<br />

Im Beispiel wurde das Kapital durchschnittlich mit xg = 1,07894<br />

verzinst. Dies entspricht einer durchschnittlichen Wachstumsrate<br />

von g = 7, 894 %.<br />

⎡ Endwert ⎤<br />

Alternative Berechnung : g = n ⎢<br />

− ⎥<br />

⎣ Anfangswert ⎦<br />

⋅ 1 100 %<br />

t−1<br />

[ ]<br />

g = F−1<br />

⋅100<br />

%<br />

[ ]<br />

g = xg−1 ⋅100<br />

%


Dr. Dietmar Hubrich Statistik I Seite 29<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Spannweite :<br />

Spannweite<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />

nach ihrer Größe geordnet.<br />

Dabei bedeutet:<br />

x<br />

1<br />

x<br />

i<br />

x<br />

n<br />

→<br />

→<br />

→<br />

X : x , x , x , ... , x<br />

1 2 3 n<br />

der kleinste Merkmalswert<br />

der i.te Merkmalswert der geordneten Reihe<br />

der größte Merkmalswert<br />

Die Differenz zwischen dem größten und dem kleinsten<br />

Merkmalswert bezeichnet die Spannweite R.<br />

R = x − x = x − x<br />

max min n 1<br />

Bei klassierten Merkmalen errechnet sich die Spannweite aus der<br />

Differenz zwischen Oberschranke der Klasse k und Unterschranke<br />

der 1. Klasse (Klasse i = 1 ... k).<br />

o u<br />

R = ek−e1 ♦ Die Spannweite ist nur ein grobes Maß zur Bestimmung der<br />

Streuung einer Verteilung.<br />

♦ „Ausreißer“ beeinflussen in hohem Maße ihren Wert.


Dr. Dietmar Hubrich Statistik I Seite 30<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Quartilsabweichung<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Sie werden<br />

nach ihrer Größe geordnet.<br />

X : x , x , x ,<br />

1 2 3<br />

... ,x n<br />

Für den Median gilt bekanntlich: F(xZ) = 0,5.<br />

Hieraus folgt für die Quartilsabweichung QA:<br />

Die Quartilsabweichung gibt die durchschnittliche Streuung<br />

von 50 % der Merkmalswerte um den Median x Z an.<br />

Gesucht werden zwei Werte für die gelten soll:<br />

u<br />

Fx ( ) = 025 ,<br />

o<br />

Fx ( ) = 075 ,<br />

Zwischen den beiden Werten liegen definitionsgemäß 50 % allen<br />

erhobenen Merkmalswerts.<br />

Die Quartilsabweichung ist definiert als die mittlere Streubreite der<br />

beiden Quartile.<br />

o<br />

u<br />

[ ( Z) ( Z ) ]<br />

1<br />

QA =<br />

2<br />

x − x + x −x<br />

1 o u<br />

QA = ⋅( x −x)<br />

2


Dr. Dietmar Hubrich Statistik I Seite 31<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Lösungen zur Quartilsabweichung (Beispiel I, Männer)<br />

Ordnen der gegebenen Werte :<br />

1650 2030 2030 3200 3200 3200 3200 3700 4100 4100 4800<br />

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11<br />

Bestimmung von x u und x o :<br />

Allgemein : Reihe in 2 gleich große Hälften aufteilen<br />

(a) bei ungeradem n xZ = xn+1<br />

2<br />

(b) Bei geradem n Re ihe 1 : x ... x<br />

1 n<br />

2<br />

Reihe<br />

2 : x ... x<br />

n n<br />

2 1 +<br />

xu : Median der <strong>Teil</strong>reihe 1 (gerades n = 6)<br />

u 1 ⎛<br />

x = ⋅ ⎜ xn 2 ⎝<br />

⎞ 1<br />

+ xn<br />

⎟ = ⋅ ( 2030 + 3200) = 2615 EUR<br />

+ ⎠ 2<br />

2 2 1<br />

xo : Median der <strong>Teil</strong>reihe 2 (gerades n = 6)<br />

o 1 ⎛<br />

x = ⋅ ⎜ xn 2 ⎝<br />

⎞ 1<br />

+ xn<br />

⎟ = ⋅ ( 3700 + 4100) = 3900 EUR<br />

+ ⎠ 2<br />

QA :<br />

1<br />

2<br />

Interpretation :<br />

2 2 1<br />

Median<br />

o u 1<br />

⋅( x − x ) = ⋅( 3900 − 2615) = 642, 5 EUR<br />

2<br />

xZ gehört zu<br />

beiden<br />

Reihen.<br />

50% der Einkommen der männlichen Arbeitnehmer werden in<br />

einem Abstand von ± 642,50 EUR um den Median im Durchschnitt<br />

angetroffen.


Dr. Dietmar Hubrich Statistik I Seite 32<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Lösungen zur Quartilsabweichung (Beispiel II, Männer)<br />

1. Schritt :<br />

Bestimmung der Quartilsklassen i u und i o. (Klassen in denen F(x)<br />

erstmals 25% bzw. 75% überschreitet.)<br />

Quartilsklasse i u = 3 : 9600 - 16000 EUR<br />

Quartilsklasse i o = 4 : 16000 - 25000 EUR<br />

2. Schritt :<br />

Bestimmung von x u.<br />

x<br />

u<br />

= d<br />

3<br />

⋅α<br />

+ e<br />

0,<br />

25 − F<br />

α 3 =<br />

F − F<br />

x<br />

u<br />

3<br />

3<br />

2<br />

2<br />

u<br />

3<br />

=<br />

mit<br />

0,<br />

25<br />

= 6400⋅<br />

0,<br />

361+<br />

9600 = 11910,<br />

40 EUR<br />

3. Schritt :<br />

d<br />

0,<br />

439<br />

Bestimmung von x o.<br />

x<br />

o<br />

= d<br />

4<br />

⋅α<br />

+ e<br />

0,<br />

75 − F3<br />

α 4 =<br />

F − F<br />

x<br />

o<br />

4<br />

4<br />

3<br />

u<br />

4<br />

=<br />

mit<br />

0,<br />

75<br />

0,<br />

847<br />

3<br />

= 16000 − 9600 = 6400<br />

− 0,<br />

143<br />

=<br />

− 0,<br />

143<br />

d<br />

4<br />

0,<br />

361<br />

= 25000 −16000<br />

= 9000<br />

− 0,<br />

439<br />

=<br />

− 0,<br />

439<br />

0,<br />

762<br />

= 9000⋅<br />

0,<br />

762 + 16000 = 22860,<br />

29 EUR<br />

4. Schritt :<br />

1<br />

2<br />

und<br />

und<br />

e<br />

u<br />

3<br />

e<br />

= 9600<br />

u<br />

4<br />

= 16000<br />

Bestimmung von QA. QA = ⋅(<br />

22860,<br />

29 −11910,<br />

40)<br />

= 5474,<br />

95 EUR<br />

Interpretation :<br />

50% der männlichen Einkommen befinden sich im Durchschnitt in<br />

einem Abstand von ± 5474,95 EUR um den Median !


Dr. Dietmar Hubrich Statistik I Seite 33<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Varianz, Standardabweichung, Variationskoeffizient<br />

Gegeben sind die Merkmalswerte xi für das Merkmal X. Eine<br />

Ordnung nach ihrer Größe ist nicht notwendig.<br />

Die Varianz des Merkmals X ( = σ2 ) ist das arithmetische<br />

Mittel der Abstandsquadrate vom Mittelwert x .<br />

Es gilt der Zerlegungssatz. D.h. die Varianz lässt sich oft einfacher<br />

berechnen über:<br />

Die Quadratwurzel aus der Varianz heißt Standardabweichung<br />

σ x.<br />

Bei klassierten Merkmalen kann die Varianz nur sehr grob<br />

angenähert berechnet werden.<br />

2<br />

σ x<br />

≈<br />

k<br />

∑<br />

i=<br />

1<br />

* ( )<br />

h ⋅ x −x<br />

X : x 1<br />

2<br />

, x , x ,<br />

2 3<br />

( )<br />

... , x n (ungeordnet)<br />

1<br />

= ⋅ −<br />

n<br />

n<br />

∑ ( x x)<br />

2<br />

σ x i<br />

i=<br />

1<br />

n<br />

n<br />

2 1 2<br />

2 1 2<br />

σx = ⋅∑( xi −x) ⇔ σx<br />

= ⋅∑xi − x<br />

n i=<br />

1<br />

n i=<br />

1<br />

n<br />

n<br />

1 2<br />

1 2<br />

σx = ⋅∑( xi −x) ⇔ σx<br />

= ⋅∑xi − x<br />

n i=<br />

1<br />

n i=<br />

1<br />

i i<br />

k<br />

∑ h i<br />

i=<br />

1<br />

k<br />

*<br />

2<br />

*<br />

= ∑fi⋅ x i − x mit x i<br />

i=<br />

1<br />

k<br />

*<br />

= Klassenmitten, x = ∑fi⋅xi<br />

i=1<br />

Der Variationskoeffizient V beschreibt die Streuung relativ<br />

zur Höhe des Mittelwertes.<br />

x V =<br />

x<br />

σ<br />

2<br />

2<br />

2


Dr. Dietmar Hubrich Statistik I Seite 34<br />

Fachhochschule der Modulteil G1-3.2<br />

Deutschen Bundesbank <strong>Teil</strong> 1<br />

Lösung zu Varianz, Standardabweichung,<br />

Variationskoeffizient im Beispiel I<br />

lfd. Nr. i xi (weiblich) xi 2 (weiblich) xi (männl.) xi 2 (männl.)<br />

1 1710 2924100 1650 2722500<br />

2 1960 3841600 2030 4120900<br />

3 2500 6250000 4800 23040000<br />

4 1480 2190400 3200 10240000<br />

5 1710 2924100 3700 13690000<br />

6 2300 5290000 4100 16810000<br />

7 3200 10240000 3200 10240000<br />

8 -- -- 2030 4120900<br />

9 -- -- 3200 10240000<br />

10 -- -- 4100 16810000<br />

11 -- -- 3200 10240000<br />

Σ 14860 33660200 35210 122274300<br />

weiblich : männlich :<br />

14860<br />

x = = 2122, 86<br />

7<br />

33660200<br />

σ x = −2122,<br />

86<br />

7<br />

2<br />

σ = 302077, 5<br />

σ<br />

2 2<br />

x<br />

x<br />

= 302077, 5 = 549, 62<br />

Variationskoeffizient :<br />

weiblich : männlich :<br />

35210<br />

x = = 3200, 91<br />

11<br />

122274300<br />

σ x = −3200,<br />

91<br />

11<br />

2<br />

σ = 870020, 62<br />

2 2<br />

σ x<br />

V =<br />

x<br />

549, 62<br />

σ x<br />

= = 026 ,<br />

V =<br />

2122, 86<br />

x<br />

932, 75<br />

= = 029 ,<br />

3200, 91<br />

V = 0,26 < V = 0,29<br />

σ<br />

x<br />

x<br />

= 870020, 62 = 932, 75

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!