12.07.2015 Aufrufe

Lösung der Beispielsaufgaben zur Vorlesung Statistik 2

Lösung der Beispielsaufgaben zur Vorlesung Statistik 2

Lösung der Beispielsaufgaben zur Vorlesung Statistik 2

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Lösung <strong>der</strong> <strong>Beispielsaufgaben</strong> <strong>zur</strong> <strong>Vorlesung</strong><strong>Statistik</strong> 2Aufgaben zu Kap. 13: Es werden von 50 Kfz verschiedenen Alters die Bremswegevon 100 km/h zum Stopp gemessen. Aus <strong>der</strong> Urliste liegen das Streudiagramm Alter vs.Bremsweg, eine Klasseneinteilung sowie die resultierende Kreuztabelle <strong>zur</strong> Auswertungvor.h(x1)=20Bremsweg (m)70y = Bremsweg (m)23510251123241h(y1)=0−5 J5−10 J> 10 J0−5 J5−10 J> 10 Jn=50Alter des Fahrzeugsx = Alter des FahrzeugsBestimmen Sie:1. Die relativen Häufigkeiten f(x i , y j ),2. die Randhäufigkeiten h(x i ) bezüglich Merkmal “Bremsweg” sowie h(y j ) bezüglichMerkmal “Alter” sowie die relativen Randhäufigkeiten f(x i ), f(y j ),3. die Randhäufigkeitsverteilungen,4. die bedingten relativen Häufigkeiten sowie die Verteilung <strong>der</strong> Bremswege für 0-10Jahre alte und für 10-15 Jahre alte Fahrzeuge,5. die Altersverteilung <strong>der</strong> Fahrzeuge mit Bremswegen unter 50 m,1


6. und einen Check auf Unabhängigkeit (ohne nichtparametrischen Test!)Lösung:(1) n = 50; z.B. f(x 1 , y 1 ) = h(x 1 , y 1 )/n = 10/50 = 0.2 = Anteil <strong>der</strong> bis 5 Jahre altenKfz mit Bremswegen kleiner 50 m.(2) Randhäufigkeiten h(x i ) bezüglich Merkmal “Bremsweg”:h(y 1 ) = ∑ 3i=1 h(x i , y 1 ) = 13: Zahl <strong>der</strong> Kfz mit Bremswegen < 50 m.h(y 2 ) = ∑ 3i=1 h(x i , y 2 ) = 20: Zahl <strong>der</strong> Kfz mit Bremswegen zwischen 50 und 60 m.etc.Reklative Häufigkeiten: f(y 1 ) = h(y 1 )/n = 0.26 = Anteil <strong>der</strong> Kfz mit Bremswegen< 50 m, etcRandhäufigkeiten h(x i ) bezüglich Merkmal “Alter”:h(x 1 ) = ∑ 4j=1 h(x 1 , y j ) = 20: Zahl <strong>der</strong> unter 5 Jahre alten Kfzf(x 1 ) = h(x 1 )/n = 0.4: Anteil <strong>der</strong> unter 5 Jahre alten Kfz, etc.(3) Randhäufigkeitsverteilung bezüglich Alter: Diese ist gegeben durch den Punkt (x u 1, 0)sowie die Punkte (x o i , F (x i ) mit– x u 1 die Klassenuntergrenze <strong>der</strong> ersten Altersklasse,– x o i die Klassenobergrenze <strong>der</strong> i-ten Altersklasse,– F (x i ) = ∑ ik=1 f(x k ) die relative Summenhäufigkeit,also hier durch die Punkte(0, 0), (5, 0.4), (10, 0.8), (15, 1).Analog ist die Verteilungsfunktion bezüglich des Bremswegs durch die Punktegegeben.(40, 0), (50, 0.26), (60, 0.66), (70, 0.86), (80, 1)Um Verteilungsfunktionen zu bestimmen, braucht man auch die jeweils “außen”liegenden Grenzen <strong>der</strong> Randklassen, z.B. x u 1 und x o n. Falls es sich um “offene Randklassen”wie im Beispiel handelt, und nichts an<strong>der</strong>es gesagt ist, werden diese näherungsweiseals geschlossenen Klassen mit gleicher Klassenbreite wie die an<strong>der</strong>enKlassen behandelt, also z.B. x u 1 = 0 und x o 3 = 15.(4) Bedingte relative Häufigkeit <strong>der</strong> Bremswegklassen für über 10 Jahre alte Fahrzeuge:i = 3.f(y j |x 3 ) = h(y j , x 3 )/h(x 3 )2


alsof(y 1 |x 3 ) = 1/10 = 0.1,f(y 2 |x 3 ) = 4/10 = 0.4,f(y 3 |x 3 ) = 2/10 = 0.2,f(y 4 |x 3 ) = 3/10 = 0.3Bedingte relative Häufigkeit <strong>der</strong> Bremswegklassen für die unter 10 Jahre alten Kfz:alsof(y 1 |x = x 1 o<strong>der</strong> x 2 ) = 12/40 = 0.3,f(y 2 |x = x 1 o<strong>der</strong> x 2 ) = 16/40 = 0.4,f(y 3 |x = x 1 o<strong>der</strong> x 2 ) = 8/40 = 0.2,f(y 4 |x = x 1 o<strong>der</strong> x 2 ) = 4/40 = 0.1.f(y j |x = x 1 o<strong>der</strong> x 2 ) = h(y j, x 1 ) + h(y j , x 2 )h(x 1 ) + h(x 2 )Die Verteilungsfunktion wird wie<strong>der</strong> wie oben aus den Punkten (y u 1 , 0) sowie (y o j , F j ),j = 1..4 berechnet, wobei j die zu den relativen Häufigkeiten f(y 1 |x 3 ) bzw. f(y j |x =x 1 o<strong>der</strong> x 2 ) gehörige Summenhäufigkeit ist. Verbindet man die Punkte linear, ergibtsich als Grafik:1Verteilungsfunktion F0.80.60.40.2Alter =10 Jahre040 45 50 55 60 65 70 75 80Bremsweg (m)(5) Altersverteilung (x o i , F i ) für Bremswege < 50 m:(0, 0), (5, 10/13), (10, 12/13), (15, 1).3


(6) z.B. f(x 1 , y 1 ) = 1, f(x 5 1)f(y 1 ) = 2 + 13 = 26 ≠ 1 ⇒ Bremsweg und Alter sind5 50 250 5empirisch abhängig. Ob die Abhängigkeit allerdings signifikant ist, wird erst in <strong>der</strong>Test-Theorie am Ende von <strong>Statistik</strong> II untersucht.4


Aufgabe zu Kap. 19.3 Leiten Sie für die hyperbolische Regressionŷ(x) = a + b/xdie Bestimmungsgleichungen für die Parameter auf beide Arten her. Verwenden Sie fürdie Transformations-Methode folgende Transformation <strong>der</strong> unabhängigen Variablen:x = 1/z(i) Lineare Regression <strong>der</strong> transformierten DatenMit folgen<strong>der</strong> Transformation <strong>der</strong> unabhängigen Variablen:x = 1 zwird die Regressionsfunktion ŷ(z) = a+bz linear und man erhält in <strong>der</strong> neuen unabhängigenVariable z die üblichen Ausdrücke für die Koeffizienten:a = ȳ − b¯z,b = s zy.s 2 zNach Rücktransformation z = 1 xerhält man für a und b folgende Ausdrücke:(ii) Direkte Regressiona = ȳ − 1 nn∑b =i=1n∑1i=1x 2 i( n ∑y ii=1x i− ȳ− 1 n)1b, (1)x in∑ 1i=1x i(∑ nDa ŷ(x) quasilinear ist, ist dies ohne Probleme möglich:F =i=1i=1(n∑y i − a − b ) 2!= min!x i⇒∂Fn∂a = 2 ∑(y i − a − b )x ii=1(∂F∂b = 2 n ∑i=1y i − a − b x i) (−1x i)5) 2(2)1x i(−1) = 0,= 0.


Daraus ein lineares Gleichungssystem für a und b:( n ∑i=1na +)1a +x i( n ∑i=1(∑ n)1b. =x i)1i=1x 2 ib =n∑y i ,i=1n∑ y i.i=1x iDaraus als Ergebnis die Koeffizienten <strong>der</strong> direkten Regression:a = ȳ − 1 nb =∑ ni=1 1x 2 i( n ∑i=1∑ ni=1 y i− 1 n)1b, (3)x ix i− ȳ ∑ n 1i=1 x( i∑ni=1 ) (1 ∑ni=1 ) (4)1x i x iDie Ausdrücke (3) und (1) für den Koeffizienten a sowie (4) und (2) für b sind identisch!Dies ist insofern anschaulich, als• einerseits bei <strong>der</strong> Regressionsrechnung ja unsymmetrisch nur die FehlerquadratsummeF bezüglich <strong>der</strong> abhängigen Variablen y minimiert wird,• an<strong>der</strong>erseits eine quasilineare Regressionsfunktion durch Transformation ausschließlich<strong>der</strong> unabhängigen Variablen <strong>zur</strong> linearen Funktion wird. Im quasilinearen Fallwird die Fehlerquadratsumme F also durch die Transformation gar nicht beeinflusst!Bei Transformation <strong>der</strong> abhängigen Koordinate sind beide Methoden i.A. nicht äquivalent!(vgl. “Exkurse 2”)Aufgabe zu Kap. 19.41. Welche Klasse von Regressionsfunktionen hat eine von x unabhängige Elastizität?2. Erläuern Sie Grenzfunktion und Elastizitätsfunktion im Zusammenhang mit <strong>der</strong>Lohnsteuertabelle (sic!). Bringen Sie dabei die Begriffe “Grenzsteuersatz und “progressiveBesteuerung” unter.Lösung:(1) Damit eine Regressionsfunktionen ŷ(x) eine von x unabhängige Elastizität beschreibt,muss gelten:ɛ yx (x) = x dŷŷ dx = C = const.6


“Bruchrechnen” mit den Differentialquotienten ergibtdŷŷ = C dx xNun wird auf beiden Seiten das unbestimmte Integral gebildet:mit <strong>der</strong> Integrationskonstante D.ln(ŷ) = C ln(x) + DAuflösen nach ŷ ergibt die gesuchte Klasse von Regressionsfunktionen (mit <strong>der</strong> neuenKonstanten A = e D ):ŷ(x) = e D e C ln(x) = A ( e ln(x)) C= Ax C .Die Elastizität ist dabei durch ɛ yx = C=const. gegeben. Zum Beispielŷ(x) = 7x: ɛ yx = 1,ŷ(x) = 0.4x : ɛ yx = −1.(2) Sei x das Einkommen und ŷ(x) die Regressionsfunktion für die bezahlte Lohnsteuery. Ohne Absetzungsmöglichkeit wäre ŷ(x) = y(x) die Steuer aus <strong>der</strong> Lohnsteuertabelle,die tatsächliche Regressionsfunktion wird wohl niedriger liegen.Die Grenzfunktion g(x) = dy kann als <strong>der</strong> bei gegebenen Einkommen im Mittelgültige Grenzsteuersatz interpretiert werden. Dieser liegt i.A. höher als <strong>der</strong>dxSteuersatz ŷ/x selbst. Das heißt, die Elastizität x dŷ= x g(x) ist größer als 1 o<strong>der</strong>ŷ dx ŷprogressiv, was lei<strong>der</strong> einer progressiven Besteuerung entspricht :(60Steuersaetze 2002 (%)5040302010Steuersatz y/xGrenzsteuersatz dy/dx00 10000 20000 30000 40000 50000 60000Einkommen x (Eur)http://home.t-online.de/home/parmentier.ffm/steuer.htm?steuer01.htm7

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!