20.08.2013 Aufrufe

Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX

Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX

Herleitung der Parameter-Gleichungen für die einfache ... - LaTeX

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Historie<br />

<strong>Herleitung</strong> <strong>der</strong> <strong>Parameter</strong>-<strong>Gleichungen</strong> <strong>für</strong> <strong>die</strong><br />

<strong>einfache</strong> lineare Regression<br />

v1.0 16.03.2009, erste Version hochgeladen<br />

Uwe Ziegenhagen<br />

2. März 2013<br />

v2.0 02.03.2013, einen Vorzeichenfehler beseitigt, diverse <strong>Gleichungen</strong> und Erläuterungen zum besseren<br />

Verständnis hinzugefügt.<br />

1 Einführung<br />

Aus <strong>der</strong> Wikipedia: Die Regressionsanalyse ist ein statistisches Analyseverfahren mit dem Ziel, Beziehungen<br />

zwischen einer abhängigen und einer o<strong>der</strong> mehreren unabhängigen Variablen festzustellen.<br />

Allgemein wird eine metrische Variable Y betrachtet, <strong>die</strong> von einer zweiten Variablen x abhängt. Üblicherweise<br />

ist x = (x1, ..., xn) T ein n-dimensionaler Vektor, wobei <strong>die</strong> einzelnen x-Werte untereinan<strong>der</strong> unabhängig<br />

sind. Im eindimensionalen Fall spricht man von einer <strong>einfache</strong>n linearen Regressionsanalyse, in<br />

Dimensionen größer gleich zwei von einer multiplen Regressionsanalyse.<br />

Bei <strong>der</strong> <strong>einfache</strong>n linearen Regression liegen Wertepaare <strong>der</strong> Form (xi, yi) mit i = 1, . . . , n vor. Als Modell<br />

wählt man<br />

Yi = b + axi + ɛi<br />

man nimmt somit einen linearen Zusammenhang zwischen xi und Yi an. Die Daten yi werden als Realisierungen<br />

<strong>der</strong> Zufallsvariablen Yi angesehen, <strong>die</strong> xi sind nicht stochastisch, son<strong>der</strong>n Messstellen. Ziel <strong>der</strong><br />

Regressionsanalyse ist in <strong>die</strong>sem Fall <strong>die</strong> Bestimmung <strong>der</strong> unbekannten <strong>Parameter</strong> a und b.<br />

Die Vorgehensweise bei <strong>der</strong> linearen Regression veranschaulicht folgende Grafik. Gegeben sind Wertepaare<br />

xi, yi, als schwarze Punkte eingezeichnet. Grün sind <strong>die</strong> Werte (ˆx, ˆy) <strong>die</strong> durch <strong>die</strong> lineare Regressionsfunktion<br />

errechnet werden. Die roten Linien symbolisieren <strong>die</strong> Abweichungen 1 ei = yi − ˆyi <strong>die</strong>ser durch<br />

<strong>die</strong> Gleichung bestimmten Punkte von den wahren Punkten. Aufgabe bei <strong>der</strong> Bestimmung <strong>der</strong> <strong>Parameter</strong><br />

ist es nun, a und b so zu wählen, dass <strong>die</strong> Summe QS <strong>der</strong> quadrierten Abweichungen – also n<br />

i=1 (yi − ˆyi) 2<br />

– minimal wird.<br />

1 Es ist egal, ob man yi − ˆyi o<strong>der</strong> ˆyi − yi schreibt, durch <strong>die</strong> Quadrierung heben sich eventuelle negative Vorzeichen auf.<br />

1<br />

(1)


2 <strong>Herleitung</strong> <strong>der</strong> <strong>Gleichungen</strong><br />

QS(a, b) =<br />

=<br />

n<br />

i=1<br />

n<br />

i=1<br />

e 2 i =<br />

n<br />

(yi − ˆyi) 2<br />

i=1<br />

<br />

yi − [axi + b]<br />

Da wir <strong>die</strong> optimalen Werte <strong>für</strong> <strong>die</strong> Minimierung <strong>die</strong>ser Quadratsumme erhalten wollen, bilden wir <strong>die</strong><br />

partiellen Ableitungen nach a und b. Vorher können wir jedoch Gleichung 2 ver<strong>einfache</strong>n. Mit Hilfe <strong>der</strong> 2.<br />

Binomischen Formel 2 lösen wir 3 auf:<br />

QS(a, b) =<br />

n<br />

i=1<br />

2<br />

<br />

y 2 i − 2yi(axi + b) + (axi + b) 2<br />

Da <strong>der</strong> Term (axi +b) 2 <strong>der</strong> 1. Binomischen Formel 3 entspricht, lösen wir auch <strong>die</strong>sen auf und ver<strong>einfache</strong>n:<br />

QS(a, b) =<br />

n<br />

i=1<br />

<br />

y 2 i − 2axiyi − 2byi + a 2 x 2 i + 2abxi + b 2<br />

Ausgehend von Gleichung 5 bilden wir jetzt <strong>die</strong> partiellen Ableitungen nach a und b:<br />

2 2. Binomische Formel: (s − t) 2 = s 2 − 2st + t 2<br />

3 1. Binomische Formel: (s + t) 2 = s 2 + 2st + t 2<br />

2<br />

(2)<br />

(3)<br />

(4)<br />

(5)


∂QS(a, b)<br />

=<br />

∂a<br />

∂QS(a, b)<br />

∂b<br />

= 2<br />

n<br />

i=1<br />

=<br />

(−2xiyi + 2ax 2 i + 2bxi) (6)<br />

n<br />

xi(−yi + axi + b) (7)<br />

i=1<br />

= 2<br />

n<br />

(−2yi + 2axi + 2b) (8)<br />

i=1<br />

n<br />

(axi + b − yi) (9)<br />

i=1<br />

Wenn wir Gleichung 9 nullsetzen und auflösen, erhalten wir<br />

n<br />

n n<br />

2 axi + 2 b − 2 yi = 0 (10)<br />

i=1<br />

i=1<br />

i=1<br />

i=1<br />

n<br />

n<br />

2 axi + 2nb − 2 yi = 0 (11)<br />

i=1<br />

i=1<br />

n n<br />

2nb = 2 yi − 2 axi<br />

Auflösen nach b (durch 2n teilen) gibt (zusammen mit <strong>der</strong> Tatsache, dass das arithmetische Mittel allge-<br />

n<br />

xi definiert ist):<br />

mein als ¯x = 1<br />

n<br />

i=1<br />

i=1<br />

n<br />

yi<br />

i=1<br />

b =<br />

n −<br />

n<br />

axi<br />

i=1<br />

n<br />

= 1<br />

n<br />

yi − a<br />

n<br />

1<br />

n<br />

n<br />

i=1<br />

Setzen wir nun b = ¯y − a¯x in Gleichung 7 ein, erhalten wir<br />

2<br />

n<br />

i=1<br />

i=1<br />

xi<br />

(12)<br />

(13)<br />

(14)<br />

= ¯y − a¯x (15)<br />

<br />

xi axi + ( ¯y − a¯x) − yi = 0 (16)<br />

3


Durch Ausmultiplizieren und Ver<strong>einfache</strong>n ergibt sich:<br />

=<br />

=<br />

0 =<br />

=<br />

=<br />

=<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

<br />

xi axi + ( ¯y − a¯x) − yi<br />

<br />

2<br />

axi + xi( ¯y − a¯x) − xiyi<br />

<br />

2<br />

axi + xi ¯y − a¯xxi − xiyi<br />

<br />

2<br />

axi − a¯xxi + xi ¯y − xiyi<br />

<br />

2<br />

(axi − a¯xxi) + xi ¯y − xiyi<br />

<br />

2<br />

axi − a¯xxi +<br />

n<br />

xi ¯y −<br />

Jetzt subtrahiert man n<br />

xiyi und ad<strong>die</strong>rt n<br />

xi ¯y, um <strong>die</strong>se beiden Teile auf <strong>die</strong> an<strong>der</strong>e Seite <strong>der</strong> Gleichung<br />

zu bekommen.<br />

i=1<br />

n<br />

i=1<br />

i=1<br />

(ax 2 i − axi ¯x) =<br />

i=1<br />

n<br />

i=1<br />

Da a konstant ist, können wir es vor <strong>die</strong> Klammer ziehen.<br />

Jetzt teilen wir durch n<br />

(x<br />

i=1<br />

2 i − xi ¯x)<br />

a<br />

n<br />

i=1<br />

(x 2 i − xi ¯x) =<br />

a =<br />

i=1<br />

xiyi −<br />

n<br />

i=1<br />

xiyi<br />

(17)<br />

(18)<br />

(19)<br />

(20)<br />

(21)<br />

(22)<br />

n<br />

xi ¯y (23)<br />

i=1<br />

n<br />

n<br />

xiyi − ¯y<br />

n<br />

xiyi − ¯y n<br />

i=1<br />

n<br />

xi<br />

i=1<br />

(x<br />

i=1<br />

2 i − xi ¯x)<br />

Aus <strong>der</strong> Definition des arithmetischen Mittels ¯x = 1 <br />

xi folgt<br />

n<br />

n<br />

xi = n¯x. Einsetzen ergibt<br />

i=1<br />

n<br />

xiyi − ¯yn¯x<br />

i=1<br />

a = n <br />

x2 i − n<br />

xi ¯x <br />

i=1<br />

Jetzt zerlegen wir <strong>die</strong> Summe unter dem Bruchstrich in Einzelsummen und ziehen ¯x vor das zweite Summenzeichen<br />

(Zur Erinnerung: konstanter Term!)<br />

a =<br />

i=1<br />

n<br />

xiyi − ¯yn¯x<br />

i=1<br />

n<br />

x<br />

i=1<br />

2 i<br />

4<br />

− ¯x n<br />

xi<br />

i=1<br />

i=1<br />

xi<br />

(24)<br />

(25)<br />

(26)<br />

(27)


Über alternative Formeln zu Varianz und Kovarianz 4 erhalten wir<br />

3 Beispiel<br />

a =<br />

n<br />

xiyi − n¯x ¯y<br />

n<br />

=<br />

− n¯x2<br />

i=1<br />

x<br />

i=1<br />

2 i<br />

<br />

1 n n<br />

<br />

1 n n<br />

n<br />

i=1<br />

<br />

xiyi − ¯x ¯y<br />

n<br />

=<br />

− ¯x2<br />

x<br />

i=1<br />

2 i<br />

n Cov(x, y)<br />

n Var(x)<br />

= Cov(x, y)<br />

Var(x)<br />

Für unser Beispiel vom Anfang hier <strong>die</strong> numerische Bestimmung <strong>der</strong> <strong>Parameter</strong>. Für ¯x erhalten wir 3, <strong>für</strong><br />

¯y = 2.4, <strong>die</strong> Summe <strong>der</strong> (x − ¯x)(y − ¯y) ergibt 3, <strong>die</strong> Summe <strong>der</strong> (x − ¯x) 2 = 10. Durch Einsetzen <strong>die</strong>ser Werte<br />

erhalten wir dann als <strong>Parameter</strong>wert <strong>für</strong> b 1.5, als <strong>Parameter</strong>wert <strong>für</strong> a 0.3, sodass <strong>die</strong> Formel unseres<br />

linearen Modells<br />

y = 0.3 · x + 1.5<br />

lautet.<br />

4 Quelldateien<br />

1 2 3 4 5 6<br />

x y x − ¯x y − ¯y (x − ¯x)(y − ¯y) (x − ¯x) 2<br />

1 1 1 -2 -1.4 2.8 4<br />

2 2 3 -1 0.6 -0.6 1<br />

3 3 2 0 -0.4 0.0 0<br />

4 4 4 1 1.6 1.6 1<br />

5 5 2 2 -0.4 -0.8 4<br />

15 12<br />

Dieses Dokument wurde mit L ATEX, dem freien Textsatzsystem, erstellt.<br />

L ATEX<br />

Metapost<br />

Metapost (kompiliert)<br />

4 Verschiebungssatz:<br />

Cov(X, Y) =<br />

<br />

E ((X − E(X))(Y − E(Y))) = E(X, Y) − E(X) E(Y)<br />

Var(X) = E (X − E(X)) 2<br />

= E(X2 ) − (E(X)) 2<br />

5<br />

(28)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!