Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX
Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX
Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Historie<br />
<strong>Herleitung</strong> <strong>der</strong> <strong>Parameter</strong>-<strong>Gleichungen</strong> <strong>für</strong> <strong>die</strong><br />
<strong>einfache</strong> lineare Regression<br />
v1.0 16.03.2009, erste Version hochgeladen<br />
Uwe Ziegenhagen<br />
2. März 2013<br />
v2.0 02.03.2013, einen Vorzeichenfehler beseitigt, diverse <strong>Gleichungen</strong> und Erläuterungen zum besseren<br />
Verständnis hinzugefügt.<br />
1 Einführung<br />
Aus <strong>der</strong> Wikipedia: Die Regressionsanalyse ist ein statistisches Analyseverfahren mit dem Ziel, Beziehungen<br />
zwischen einer abhängigen und einer o<strong>der</strong> mehreren unabhängigen Variablen festzustellen.<br />
Allgemein wird eine metrische Variable Y betrachtet, <strong>die</strong> von einer zweiten Variablen x abhängt. Üblicherweise<br />
ist x = (x1, ..., xn) T ein n-dimensionaler Vektor, wobei <strong>die</strong> einzelnen x-Werte untereinan<strong>der</strong> unabhängig<br />
sind. Im eindimensionalen Fall spricht man von einer <strong>einfache</strong>n linearen Regressionsanalyse, in<br />
Dimensionen größer gleich zwei von einer multiplen Regressionsanalyse.<br />
Bei <strong>der</strong> <strong>einfache</strong>n linearen Regression liegen Wertepaare <strong>der</strong> Form (xi, yi) mit i = 1, . . . , n vor. Als Modell<br />
wählt man<br />
Yi = b + axi + ɛi<br />
man nimmt somit einen linearen Zusammenhang zwischen xi und Yi an. Die Daten yi werden als Realisierungen<br />
<strong>der</strong> Zufallsvariablen Yi angesehen, <strong>die</strong> xi sind nicht stochastisch, son<strong>der</strong>n Messstellen. Ziel <strong>der</strong><br />
Regressionsanalyse ist in <strong>die</strong>sem Fall <strong>die</strong> Bestimmung <strong>der</strong> unbekannten <strong>Parameter</strong> a und b.<br />
Die Vorgehensweise bei <strong>der</strong> linearen Regression veranschaulicht folgende Grafik. Gegeben sind Wertepaare<br />
xi, yi, als schwarze Punkte eingezeichnet. Grün sind <strong>die</strong> Werte (ˆx, ˆy) <strong>die</strong> durch <strong>die</strong> lineare Regressionsfunktion<br />
errechnet werden. Die roten Linien symbolisieren <strong>die</strong> Abweichungen 1 ei = yi − ˆyi <strong>die</strong>ser durch<br />
<strong>die</strong> Gleichung bestimmten Punkte von den wahren Punkten. Aufgabe bei <strong>der</strong> Bestimmung <strong>der</strong> <strong>Parameter</strong><br />
ist es nun, a und b so zu wählen, dass <strong>die</strong> Summe QS <strong>der</strong> quadrierten Abweichungen – also n<br />
i=1 (yi − ˆyi) 2<br />
– minimal wird.<br />
1 Es ist egal, ob man yi − ˆyi o<strong>der</strong> ˆyi − yi schreibt, durch <strong>die</strong> Quadrierung heben sich eventuelle negative Vorzeichen auf.<br />
1<br />
(1)
2 <strong>Herleitung</strong> <strong>der</strong> <strong>Gleichungen</strong><br />
QS(a, b) =<br />
=<br />
n<br />
i=1<br />
n<br />
i=1<br />
e 2 i =<br />
n<br />
(yi − ˆyi) 2<br />
i=1<br />
<br />
yi − [axi + b]<br />
Da wir <strong>die</strong> optimalen Werte <strong>für</strong> <strong>die</strong> Minimierung <strong>die</strong>ser Quadratsumme erhalten wollen, bilden wir <strong>die</strong><br />
partiellen Ableitungen nach a und b. Vorher können wir jedoch Gleichung 2 ver<strong>einfache</strong>n. Mit Hilfe <strong>der</strong> 2.<br />
Binomischen Formel 2 lösen wir 3 auf:<br />
QS(a, b) =<br />
n<br />
i=1<br />
2<br />
<br />
y 2 i − 2yi(axi + b) + (axi + b) 2<br />
Da <strong>der</strong> Term (axi +b) 2 <strong>der</strong> 1. Binomischen Formel 3 entspricht, lösen wir auch <strong>die</strong>sen auf und ver<strong>einfache</strong>n:<br />
QS(a, b) =<br />
n<br />
i=1<br />
<br />
y 2 i − 2axiyi − 2byi + a 2 x 2 i + 2abxi + b 2<br />
Ausgehend von Gleichung 5 bilden wir jetzt <strong>die</strong> partiellen Ableitungen nach a und b:<br />
2 2. Binomische Formel: (s − t) 2 = s 2 − 2st + t 2<br />
3 1. Binomische Formel: (s + t) 2 = s 2 + 2st + t 2<br />
2<br />
(2)<br />
(3)<br />
(4)<br />
(5)
∂QS(a, b)<br />
=<br />
∂a<br />
∂QS(a, b)<br />
∂b<br />
= 2<br />
n<br />
i=1<br />
=<br />
(−2xiyi + 2ax 2 i + 2bxi) (6)<br />
n<br />
xi(−yi + axi + b) (7)<br />
i=1<br />
= 2<br />
n<br />
(−2yi + 2axi + 2b) (8)<br />
i=1<br />
n<br />
(axi + b − yi) (9)<br />
i=1<br />
Wenn wir Gleichung 9 nullsetzen und auflösen, erhalten wir<br />
n<br />
n n<br />
2 axi + 2 b − 2 yi = 0 (10)<br />
i=1<br />
i=1<br />
i=1<br />
i=1<br />
n<br />
n<br />
2 axi + 2nb − 2 yi = 0 (11)<br />
i=1<br />
i=1<br />
n n<br />
2nb = 2 yi − 2 axi<br />
Auflösen nach b (durch 2n teilen) gibt (zusammen mit <strong>der</strong> Tatsache, dass das arithmetische Mittel allge-<br />
n<br />
xi definiert ist):<br />
mein als ¯x = 1<br />
n<br />
i=1<br />
i=1<br />
n<br />
yi<br />
i=1<br />
b =<br />
n −<br />
n<br />
axi<br />
i=1<br />
n<br />
= 1<br />
n<br />
yi − a<br />
n<br />
1<br />
n<br />
n<br />
i=1<br />
Setzen wir nun b = ¯y − a¯x in Gleichung 7 ein, erhalten wir<br />
2<br />
n<br />
i=1<br />
i=1<br />
xi<br />
(12)<br />
(13)<br />
(14)<br />
= ¯y − a¯x (15)<br />
<br />
xi axi + ( ¯y − a¯x) − yi = 0 (16)<br />
3
Durch Ausmultiplizieren und Ver<strong>einfache</strong>n ergibt sich:<br />
=<br />
=<br />
0 =<br />
=<br />
=<br />
=<br />
n<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
<br />
xi axi + ( ¯y − a¯x) − yi<br />
<br />
2<br />
axi + xi( ¯y − a¯x) − xiyi<br />
<br />
2<br />
axi + xi ¯y − a¯xxi − xiyi<br />
<br />
2<br />
axi − a¯xxi + xi ¯y − xiyi<br />
<br />
2<br />
(axi − a¯xxi) + xi ¯y − xiyi<br />
<br />
2<br />
axi − a¯xxi +<br />
n<br />
xi ¯y −<br />
Jetzt subtrahiert man n<br />
xiyi und ad<strong>die</strong>rt n<br />
xi ¯y, um <strong>die</strong>se beiden Teile auf <strong>die</strong> an<strong>der</strong>e Seite <strong>der</strong> Gleichung<br />
zu bekommen.<br />
i=1<br />
n<br />
i=1<br />
i=1<br />
(ax 2 i − axi ¯x) =<br />
i=1<br />
n<br />
i=1<br />
Da a konstant ist, können wir es vor <strong>die</strong> Klammer ziehen.<br />
Jetzt teilen wir durch n<br />
(x<br />
i=1<br />
2 i − xi ¯x)<br />
a<br />
n<br />
i=1<br />
(x 2 i − xi ¯x) =<br />
a =<br />
i=1<br />
xiyi −<br />
n<br />
i=1<br />
xiyi<br />
(17)<br />
(18)<br />
(19)<br />
(20)<br />
(21)<br />
(22)<br />
n<br />
xi ¯y (23)<br />
i=1<br />
n<br />
n<br />
xiyi − ¯y<br />
n<br />
xiyi − ¯y n<br />
i=1<br />
n<br />
xi<br />
i=1<br />
(x<br />
i=1<br />
2 i − xi ¯x)<br />
Aus <strong>der</strong> Definition des arithmetischen Mittels ¯x = 1 <br />
xi folgt<br />
n<br />
n<br />
xi = n¯x. Einsetzen ergibt<br />
i=1<br />
n<br />
xiyi − ¯yn¯x<br />
i=1<br />
a = n <br />
x2 i − n<br />
xi ¯x <br />
i=1<br />
Jetzt zerlegen wir <strong>die</strong> Summe unter dem Bruchstrich in Einzelsummen und ziehen ¯x vor das zweite Summenzeichen<br />
(Zur Erinnerung: konstanter Term!)<br />
a =<br />
i=1<br />
n<br />
xiyi − ¯yn¯x<br />
i=1<br />
n<br />
x<br />
i=1<br />
2 i<br />
4<br />
− ¯x n<br />
xi<br />
i=1<br />
i=1<br />
xi<br />
(24)<br />
(25)<br />
(26)<br />
(27)
Über alternative Formeln zu Varianz und Kovarianz 4 erhalten wir<br />
3 Beispiel<br />
a =<br />
n<br />
xiyi − n¯x ¯y<br />
n<br />
=<br />
− n¯x2<br />
i=1<br />
x<br />
i=1<br />
2 i<br />
<br />
1 n n<br />
<br />
1 n n<br />
n<br />
i=1<br />
<br />
xiyi − ¯x ¯y<br />
n<br />
=<br />
− ¯x2<br />
x<br />
i=1<br />
2 i<br />
n Cov(x, y)<br />
n Var(x)<br />
= Cov(x, y)<br />
Var(x)<br />
Für unser Beispiel vom Anfang hier <strong>die</strong> numerische Bestimmung <strong>der</strong> <strong>Parameter</strong>. Für ¯x erhalten wir 3, <strong>für</strong><br />
¯y = 2.4, <strong>die</strong> Summe <strong>der</strong> (x − ¯x)(y − ¯y) ergibt 3, <strong>die</strong> Summe <strong>der</strong> (x − ¯x) 2 = 10. Durch Einsetzen <strong>die</strong>ser Werte<br />
erhalten wir dann als <strong>Parameter</strong>wert <strong>für</strong> b 1.5, als <strong>Parameter</strong>wert <strong>für</strong> a 0.3, sodass <strong>die</strong> Formel unseres<br />
linearen Modells<br />
y = 0.3 · x + 1.5<br />
lautet.<br />
4 Quelldateien<br />
1 2 3 4 5 6<br />
x y x − ¯x y − ¯y (x − ¯x)(y − ¯y) (x − ¯x) 2<br />
1 1 1 -2 -1.4 2.8 4<br />
2 2 3 -1 0.6 -0.6 1<br />
3 3 2 0 -0.4 0.0 0<br />
4 4 4 1 1.6 1.6 1<br />
5 5 2 2 -0.4 -0.8 4<br />
15 12<br />
Dieses Dokument wurde mit L ATEX, dem freien Textsatzsystem, erstellt.<br />
L ATEX<br />
Metapost<br />
Metapost (kompiliert)<br />
4 Verschiebungssatz:<br />
Cov(X, Y) =<br />
<br />
E ((X − E(X))(Y − E(Y))) = E(X, Y) − E(X) E(Y)<br />
Var(X) = E (X − E(X)) 2<br />
= E(X2 ) − (E(X)) 2<br />
5<br />
(28)