15.01.2013 Aufrufe

Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...

Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...

Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Rate</strong> <strong>und</strong> <strong>Survivorfunktion</strong>: <strong>drei</strong> <strong>unterschiedliche</strong> <strong>Merkmalsgruppen</strong><br />

Abb. 1: <strong>Rate</strong>nfunktionen Abb. 2: zugehörige <strong>Survivorfunktion</strong>en<br />

Wert der <strong>Rate</strong><br />

,13<br />

,12<br />

,11<br />

,10<br />

,09<br />

,08<br />

,07<br />

0<br />

4<br />

8<br />

12<br />

16<br />

20<br />

24<br />

Prozesszeit in Monaten<br />

28<br />

32<br />

36<br />

G(t) = Anteil ohne Ereignis<br />

1,0<br />

,8<br />

,6<br />

,4<br />

,2<br />

0,0<br />

0<br />

4<br />

8<br />

12<br />

16<br />

r = 0.08<br />

r = 0.1<br />

r = 0.12<br />

Prozesszeit in Monaten<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 1<br />

20<br />

24<br />

28<br />

32<br />

36


Das Exponentialmodell: Zeitkonstante Kovariaten<br />

Wie wirken sich zeitkonstante Merkmale der Beobachtungseinheiten<br />

auf die zeitkonstante Übergangsrate r aus?<br />

Regressionsgleichung:<br />

⎡β<br />

0 ⎤<br />

⎢ ⎥<br />

⎢<br />

β1<br />

β = ⎥<br />

⎢β<br />

⎥ 2<br />

⎢ ⎥<br />

⎣β<br />

k ⎦<br />

[ x x x x ]<br />

X '= 0 1 2<br />

r = exp( β + β x + ... + β x ) = exp( βX<br />

X‘: Zeilenvektor zeitkonstanter Merkmale der Beobachtungseinheiten<br />

ββββ : Spaltenvektor der Regressionskoeffizienten, β 0 ist die Konstante<br />

0<br />

= exp( β ) ⋅exp(<br />

β )<br />

0<br />

k<br />

1<br />

1<br />

1<br />

x<br />

1<br />

k<br />

k<br />

⋅...<br />

⋅exp(<br />

β )<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 2<br />

k<br />

x<br />

k<br />

')


Die Schätzung der Koeffizienten β0 , ... , βk erfolgt wieder nach dem<br />

Maximum-Likelihood Verfahren.<br />

Log-Likelihood für das Exponentialmodell mit zeitkonstanten<br />

Kovariaten X :<br />

wir erinnern uns: ) = exp( β + β x + ... + β<br />

ln[ ( r | ti<br />

, X i , i ∈ S)]<br />

= ln[ r(<br />

t )] + ln[<br />

G(<br />

t i)]<br />

=<br />

+<br />

∑<br />

i∈E<br />

∑[<br />

- exp( β + + + • ]<br />

0 β1x1<br />

... βkx<br />

k ) ti<br />

i∈S<br />

L ∑ ∑<br />

[ β + β x<br />

0<br />

i<br />

1<br />

i<br />

1<br />

i<br />

i∈E<br />

i∈S<br />

∈ S)]<br />

= ∑ ln[ r(<br />

ti<br />

)] + ∑<br />

i∈E<br />

i∈S<br />

ln[ L( r | t , X , i<br />

− r(<br />

t ) • t<br />

+ ... + β x<br />

[ L(r | t , X , i ∈S)<br />

] = max ln[<br />

L( β ,..., β | t , i ∈S)<br />

]<br />

rˆ = max ln i i<br />

0 k i<br />

r 0<br />

k<br />

k<br />

]<br />

r(ti 0 1 1<br />

kx<br />

k )<br />

β ,..., β<br />

k<br />

i<br />

Aufgabe für Algorithmus:<br />

maximiere Log-Likelihood<br />

bei gegebenen Daten<br />

X hinsichtlich der Parameter<br />

ββββ 0 bis ββββ k<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 3<br />

i


<strong>Rate</strong>nregression mit zeitkonstanten Kovariaten: Exponentialmodell<br />

rate( #Aufstiege<br />

xa(0,1)=Frau,PRES,EDU,<br />

rrisk,<br />

)=2;<br />

Regressionsmodell: y=β 0 + β 1 *x 1 +...+ β k *x k +e<br />

r(t)=exp(-5.01+0.036*Frau-0.1*PRES +0.2255* EDU)<br />

Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />

-------------------------------------------------------------------<br />

1 1 0 1 A Constant<br />

⎡β<br />

0 ⎤<br />

-5.0103 0.8372 -5.9843 1.0000<br />

⎢ ⎥<br />

2 1 0 1 A Frau ⎢<br />

β1<br />

⎥ 0.0359 0.3493 0.1029 0.0819<br />

3 1 0 1 A PRES ⎢β<br />

⎥ -0.1025 0.0208 -4.9310 1.0000<br />

2<br />

4 1 0 1 A EDU ⎢ ⎥ 0.2255 0.0531 4.2442 1.0000<br />

⎣β<br />

3 ⎦<br />

Wie wird aus den geschätzten Koeffizienten die <strong>Rate</strong> berechnet?<br />

r = exp( β + β x + ... + β x<br />

x1<br />

) = exp( β ) ⋅ exp( β ) ⋅...<br />

⋅ exp( β )<br />

0 1 1<br />

k k<br />

0<br />

1<br />

k<br />

x k<br />

Verändert sich die Kovariate xj <strong>und</strong> eine Einheit (∆x Einheiten),<br />

verändert sich die Schätzung für r um den Faktor exp(βk ) bzw. exp(β3 ) ∆x .<br />

a) EDU => exp(0.2255)=1.25, mit jedem Jahr EDU steigt r um das 1.25fache<br />

b) gegenüber Abi (EDU =13) erhöht ein Studium (EDU =18) die <strong>Rate</strong> um<br />

exp(β 3 ) ∆x = exp(0.2255) 5 = 3.08, bzw. [exp(0.2255) 5 – 1 ] * 100% = 208%<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 4


Zwei Varianten von Signifikanztests für die Regressionskoeffizienten:<br />

1.) T-Test, woher kommt σσσσ ? Diagonalelemente von H ˆ −1<br />

( − ) / n<br />

ˆ βk<br />

t =<br />

ˆ σ ( ˆ βk<br />

)<br />

Hˆ<br />

2 ⎡ ∂ l<br />

⎢ 2<br />

⎢<br />

∂x<br />

1<br />

= ⎢ .<br />

2 ⎢ ∂ l<br />

⎢<br />

⎣ ∂x<br />

k ∂x<br />

1<br />

...<br />

...<br />

2<br />

∂ l ⎤<br />

⎥<br />

∂x<br />

1 ∂x<br />

k ⎥<br />

. ⎥<br />

2<br />

∂ l ⎥<br />

2 ⎥<br />

∂x<br />

k ⎦<br />

2. Ableitungen:<br />

„Steigung der<br />

Steigung“ der Log-<br />

Likelihoodfunktion<br />

für den jeweiligen<br />

2.) Likelihood- Ratio Test (LR-Test)<br />

Parameter<br />

Vergleich der Log-Likelihood des Modells mit Referenzmodell<br />

LL 1 : Referenzmodell: r = exp(β 0 + β 1 x 1 )<br />

LL 2 : um β 2 x 2 erweitert: r = exp (β 0 + β 1 x 1 + β 2 x 2 )<br />

Oder:<br />

LL 0 Referenzmodell: r = exp(β 0 ) „Nullmodell“<br />

LL 2 Erweitertes Modell: r = exp (β 0 + β 1 x 1 + β 2 x 2 )<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 5


Vergleich der Log-Likelihood-Werte zweier Modelle führt zu<br />

Likelihood-Ratio Test (LR), der annäherungsweise χ 2 verteilt ist:<br />

χ 2 =2 * [ LL 1 –LL 0 ] df=Zahl der neuen Parameter<br />

χ 2 =2 * [ LL(aktuelles Modell) – LL(Referenzmodell) ]<br />

a) Aktuelles Modell enthält gegenüber dem Referenzmodell eine<br />

erklärende Variable <strong>und</strong> einen Parameter mehr. Information<br />

entspricht T-Test. Bei kleinen Fallzahlen hat LR-Test Priorität!<br />

Oder Gruppe von Variablen (z.B. Dummies für Kohorten)<br />

b) Aktuelles Modell mit k erklärenden Variablen ist Ihr „bestes“.<br />

Passt das Gesamtmodell signifikant besser zu den Daten als<br />

Modell ohne Kovariaten? χ 2 - Test analog zum F-Test der<br />

Signifikanz des R 2 in OLS Regression.<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 6


Beispiel: <strong>Rate</strong> des Verlassens der Arbeitsstelle (exp1.cf)<br />

Referenzmodell:<br />

Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />

-------------------------------------------------------------------<br />

1 1 0 1 A Constant -5.1123 0.2442 -20.9327 1.0000<br />

2 1 0 1 A Frau 0.5969 0.0948 6.2950 1.0000<br />

3 1 0 1 A EDU 0.0348 0.0205 1.6958 0.9101<br />

Log likelihood (starting values): -2514.0201<br />

Log likelihood (final estimates): -2494.4869<br />

aktuelles Modell: Variable Lfx wird eingeführt<br />

Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />

-------------------------------------------------------------------<br />

1 1 0 1 A Constant -4.8284 0.2530 -19.0815 1.0000<br />

2 1 0 1 A Frau 0.5236 0.0957 5.4694 1.0000<br />

3 1 0 1 A EDU 0.0294 0.0208 1.4087 0.8411<br />

4 1 0 1 A Lfx -0.0038 0.0008 -4.7709 1.0000<br />

Log likelihood (starting values): -2514.0201<br />

Log likelihood (final estimates): -2481.2854<br />

χ 2 =2 * [ LL(aktuelles Modell) – LL(Referenzmodell) ]<br />

χ 2 =2*[ -2481,28 - (-2494,48) ]=2*13,2=26,4 (df=1), 1- p=0.9906<br />

automatisiert: lr_test.cf<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 7


Ereignisanalyse: Exponentialmodell<br />

Modellvarianten, nicht nur für Exponentialmodell: exp1.cf<br />

1.) Ein Zielzustand, eine Episode pro Person<br />

2.) Ein Zielzustand, mehrere Episoden pro Person<br />

3.) Ein Zielzustand, mehrere Episoden pro Person, Effekte für jeden<br />

Übergang separat geschätzt<br />

4.) Mehrere Zielzustände: competing risk models<br />

dblock=ID,<br />

Lfx=cum(Dur)-Dur,<br />

# Vorgeschichte<br />

Ep_1=SN - 1,<br />

1. Aufgabenblatt, auch mit pre<br />

Anzahl der vorangegangenen Episoden<br />

# Kovariate: Effekt von Lfx fuer beide Geschlechter<br />

# Interaktionsterm<br />

Lfx_fr=Frau[1]*Lfx,<br />

Interaktionsterm<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 8


Ereignisanalyse: Exponentialmodell<br />

edef(<br />

org=0,<br />

des=DES,<br />

Definition der Episodendaten → bekannt!<br />

ts=0,<br />

tf=Dur,<br />

);<br />

# Regressionsmodell: <strong>Rate</strong> von Geschlecht abhängig<br />

rate(<br />

xa(0,1)=Frau, # x-Vektor auf den a-Term<br />

rrisk, # relative Risiken, exp(beta)<br />

)=2; # 2=exponential model<br />

# Regressionsmodell: <strong>Rate</strong> von Geschlecht abhängig,<br />

# unter Kontrolle des Ausbildungsniveaus ("highest")<br />

rate(<br />

xa(0,1)=Frau,EDU,<br />

rrisk,<br />

)=2;<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 9


Ereignisanalyse: Exponentialmodell<br />

Mehrere Episoden pro Person:<br />

• Problem: Episoden sind nicht unabhängig voneinander.<br />

• Lösungsansatz 1.) : Kontrolle der Vorgeschichte, hier:<br />

Berufserfahrung <strong>und</strong> Zahl der vorangegangenen Episoden.<br />

• Lösungsansatz 2.) : separate Modellierung der Übergänge<br />

rate(<br />

xa(0,1)=Frau,EDU,Lfx,<br />

rrisk,<br />

)=2;<br />

rate(<br />

xa(0,1)=Frau,EDU,Lfx,Ep_1,<br />

rrisk,<br />

)=2;<br />

1.) Kontrolle der Vorgeschichte<br />

Berufserfahrung<br />

Anzahl der vorangegangenen Episoden. Problem:<br />

was misst diese Variable genau? Zumindest Kontrolle<br />

„unbeobachteter Heterogenität“, die mit häufigem<br />

Wechseln korreliert.<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 10


Ereignisanalyse: Exponentialmodell<br />

2.) separate Modellierung der einzelnen Übergänge<br />

edef(<br />

org=0,<br />

des=DES,<br />

ts=0,<br />

tf=Dur,<br />

id=ID,<br />

sn=SN, # Mehrepisodenfall,<br />

);<br />

• wenn SN nicht vorhanden, Variable bilden mit:<br />

dblock=ID,<br />

SN=brec,<br />

• Problem des Ansatzes: schwindende Fallzahlen mit steigender<br />

Episodennummer. Begrenzung auf „die ersten Episoden“ wiederum<br />

problematisch, da „Mover“ zu gering vertreten sind.<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 11


Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />

Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />

-------------------------------------------------------------------<br />

1 1 0 1 A Constant -4.7610 0.2541 -18.7397 1.0000<br />

2 1 0 1 A Frau 0.3834 0.1166 3.2884 0.9990<br />

3 1 0 1 A EDU 0.0289 0.0208 1.3869 0.8345<br />

4 1 0 1 A Lfx -0.0051 0.0011 -4.8416 1.0000<br />

5 1 0 1 A Lfx_fr 0.0034 0.0016 2.1305 0.9669<br />

Regressionsmodell, allgemeine Darstellung:<br />

y=b ^<br />

0+b1x1+...+bnxn Regressionsmodell mit Interaktion Berufserfahrung x Frau:<br />

r(t)=exp(-4.76+0.3834*Frau+0.0289*EDU<br />

-0.0051*Lfx+0.0034*Lfx_fr)<br />

b(Lfx) =Effekt für Männer<br />

b(Lfx)+b(Lfx_fr) =Effekt für Frauen<br />

Resultat:<br />

Effekt für Männer negativ. Effekt für Frauen auch, jedoch weniger<br />

stark. Berufserfahrung wirkt sich für Frauen also weniger<br />

stabilisierend aus, als für Männer<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 12


Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />

Wichtig: anschauliche Darstellung der empirischen Bef<strong>und</strong>e<br />

• Ereignisanalytisches Regressionsmodell: wenig anschaulich,<br />

zumal mit Interaktionseffekt<br />

• <strong>Survivorfunktion</strong>: einfach, sehr anschaulich<br />

Anhand der geschätzten Parameter können <strong>Survivorfunktion</strong>en für<br />

spezifische Merkmalskonstellationen berechnet werden.<br />

→prate-Option im Rahmen des rate- Befehls<br />

liefert für jeden gewählten Zeitpunkt G(t), f(t) <strong>und</strong> r(t)<br />

Ergebnis wird grafisch dargestellt<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 13


Anteil noch im Job<br />

Abb. 1: Einfluss der Berufserfahrung auf die<br />

Beschäftigungsstabilität, getrennt nach Geschlecht<br />

1,0<br />

,9<br />

,8<br />

,7<br />

,6<br />

,5<br />

,4<br />

,3<br />

,2<br />

,1<br />

0,0<br />

0<br />

2<br />

Lfx Lfx=60 Lfx Lfx =60 Monate<br />

Monate<br />

Lfx Lfx=24 Lfx =24 Monate<br />

Monate<br />

4<br />

6<br />

8<br />

10<br />

12<br />

14<br />

16<br />

18<br />

20<br />

22<br />

24<br />

Prozesszeit in Monaten<br />

Quelle: MPI-Lebensverlaufsstudie, eigene Berechungen<br />

26<br />

28<br />

30<br />

32<br />

34<br />

36<br />

Männer<br />

Männer<br />

Frauen<br />

Frauen<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 14


Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />

prate: berechne auf Basis der im Modell geschätzten Koeffizienten<br />

(Regressionsgleichung) die <strong>Rate</strong> über die Zeitachse hinweg. Und zwar<br />

für bestimmte Merkmalskombinationen, die gerade von Interesse sind.<br />

Hier: Interaktion Frau ×××× Lfx<br />

rate(<br />

xa(0,1)=Frau,EDU,Lfx,Lfx_fr,<br />

rrisk,<br />

# Frauen, 2 Jahre Berufserfahrung<br />

prate(tab=0(1)36,Frau=1,EDU=12,Lfx=24,Lfx_fr=24)=Frau24.t,<br />

# Maenner, 2 Jahre Berufserfahrung<br />

prate(tab=0(1)36,Frau=0,EDU=12,Lfx=24,Lfx_fr=0)=Mann24.t,<br />

# Frauen, 5 Jahre Berufserfahrung<br />

prate(tab=0(1)36,Frau=1,EDU=12,Lfx=60,Lfx_fr=60)=Frau60.t,<br />

# Maenner, 5 Jahre Berufserfahrung<br />

prate(tab=0(1)36,Frau=0,EDU=12,Lfx=60,Lfx_fr=0)=Mann60.t,<br />

)=2;<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 15


Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />

„trivial“ matching: Zusammenführen der Datensätze durch<br />

einfaches nebeneinander legen. Hier ausreichend, weil die<br />

Zeitachse für jede Matrix identisch ist.<br />

Frau24.t Frau60.t Mann24.t Mann60.t<br />

0 1<br />

1 0.99<br />

2 0.96<br />

3 0.91<br />

. .<br />

. .<br />

36 0.57<br />

0 1<br />

1 0.99<br />

2 0.98<br />

3 0.97<br />

. .<br />

. .<br />

36 0.60<br />

0 1<br />

1 0.99<br />

2 0.98<br />

3 0.98<br />

. .<br />

. .<br />

36 0.74<br />

0 1<br />

1 0.99<br />

2 0.99<br />

3 0.99<br />

.<br />

.<br />

36 0.80<br />

Dann wird<br />

Datensatz in SPSS<br />

eingelesen <strong>und</strong><br />

Grafik erstellt mit:<br />

g_interaktion.sps<br />

4 Datensätze werden zu einem Datensatz verb<strong>und</strong>en <strong>und</strong><br />

herausgeschrieben, weil clear; Befehl fehlt<br />

M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 16

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!