Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...
Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...
Rate und Survivorfunktion: drei unterschiedliche Merkmalsgruppen ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Rate</strong> <strong>und</strong> <strong>Survivorfunktion</strong>: <strong>drei</strong> <strong>unterschiedliche</strong> <strong>Merkmalsgruppen</strong><br />
Abb. 1: <strong>Rate</strong>nfunktionen Abb. 2: zugehörige <strong>Survivorfunktion</strong>en<br />
Wert der <strong>Rate</strong><br />
,13<br />
,12<br />
,11<br />
,10<br />
,09<br />
,08<br />
,07<br />
0<br />
4<br />
8<br />
12<br />
16<br />
20<br />
24<br />
Prozesszeit in Monaten<br />
28<br />
32<br />
36<br />
G(t) = Anteil ohne Ereignis<br />
1,0<br />
,8<br />
,6<br />
,4<br />
,2<br />
0,0<br />
0<br />
4<br />
8<br />
12<br />
16<br />
r = 0.08<br />
r = 0.1<br />
r = 0.12<br />
Prozesszeit in Monaten<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 1<br />
20<br />
24<br />
28<br />
32<br />
36
Das Exponentialmodell: Zeitkonstante Kovariaten<br />
Wie wirken sich zeitkonstante Merkmale der Beobachtungseinheiten<br />
auf die zeitkonstante Übergangsrate r aus?<br />
Regressionsgleichung:<br />
⎡β<br />
0 ⎤<br />
⎢ ⎥<br />
⎢<br />
β1<br />
β = ⎥<br />
⎢β<br />
⎥ 2<br />
⎢ ⎥<br />
⎣β<br />
k ⎦<br />
[ x x x x ]<br />
X '= 0 1 2<br />
r = exp( β + β x + ... + β x ) = exp( βX<br />
X‘: Zeilenvektor zeitkonstanter Merkmale der Beobachtungseinheiten<br />
ββββ : Spaltenvektor der Regressionskoeffizienten, β 0 ist die Konstante<br />
0<br />
= exp( β ) ⋅exp(<br />
β )<br />
0<br />
k<br />
1<br />
1<br />
1<br />
x<br />
1<br />
k<br />
k<br />
⋅...<br />
⋅exp(<br />
β )<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 2<br />
k<br />
x<br />
k<br />
')
Die Schätzung der Koeffizienten β0 , ... , βk erfolgt wieder nach dem<br />
Maximum-Likelihood Verfahren.<br />
Log-Likelihood für das Exponentialmodell mit zeitkonstanten<br />
Kovariaten X :<br />
wir erinnern uns: ) = exp( β + β x + ... + β<br />
ln[ ( r | ti<br />
, X i , i ∈ S)]<br />
= ln[ r(<br />
t )] + ln[<br />
G(<br />
t i)]<br />
=<br />
+<br />
∑<br />
i∈E<br />
∑[<br />
- exp( β + + + • ]<br />
0 β1x1<br />
... βkx<br />
k ) ti<br />
i∈S<br />
L ∑ ∑<br />
[ β + β x<br />
0<br />
i<br />
1<br />
i<br />
1<br />
i<br />
i∈E<br />
i∈S<br />
∈ S)]<br />
= ∑ ln[ r(<br />
ti<br />
)] + ∑<br />
i∈E<br />
i∈S<br />
ln[ L( r | t , X , i<br />
− r(<br />
t ) • t<br />
+ ... + β x<br />
[ L(r | t , X , i ∈S)<br />
] = max ln[<br />
L( β ,..., β | t , i ∈S)<br />
]<br />
rˆ = max ln i i<br />
0 k i<br />
r 0<br />
k<br />
k<br />
]<br />
r(ti 0 1 1<br />
kx<br />
k )<br />
β ,..., β<br />
k<br />
i<br />
Aufgabe für Algorithmus:<br />
maximiere Log-Likelihood<br />
bei gegebenen Daten<br />
X hinsichtlich der Parameter<br />
ββββ 0 bis ββββ k<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 3<br />
i
<strong>Rate</strong>nregression mit zeitkonstanten Kovariaten: Exponentialmodell<br />
rate( #Aufstiege<br />
xa(0,1)=Frau,PRES,EDU,<br />
rrisk,<br />
)=2;<br />
Regressionsmodell: y=β 0 + β 1 *x 1 +...+ β k *x k +e<br />
r(t)=exp(-5.01+0.036*Frau-0.1*PRES +0.2255* EDU)<br />
Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />
-------------------------------------------------------------------<br />
1 1 0 1 A Constant<br />
⎡β<br />
0 ⎤<br />
-5.0103 0.8372 -5.9843 1.0000<br />
⎢ ⎥<br />
2 1 0 1 A Frau ⎢<br />
β1<br />
⎥ 0.0359 0.3493 0.1029 0.0819<br />
3 1 0 1 A PRES ⎢β<br />
⎥ -0.1025 0.0208 -4.9310 1.0000<br />
2<br />
4 1 0 1 A EDU ⎢ ⎥ 0.2255 0.0531 4.2442 1.0000<br />
⎣β<br />
3 ⎦<br />
Wie wird aus den geschätzten Koeffizienten die <strong>Rate</strong> berechnet?<br />
r = exp( β + β x + ... + β x<br />
x1<br />
) = exp( β ) ⋅ exp( β ) ⋅...<br />
⋅ exp( β )<br />
0 1 1<br />
k k<br />
0<br />
1<br />
k<br />
x k<br />
Verändert sich die Kovariate xj <strong>und</strong> eine Einheit (∆x Einheiten),<br />
verändert sich die Schätzung für r um den Faktor exp(βk ) bzw. exp(β3 ) ∆x .<br />
a) EDU => exp(0.2255)=1.25, mit jedem Jahr EDU steigt r um das 1.25fache<br />
b) gegenüber Abi (EDU =13) erhöht ein Studium (EDU =18) die <strong>Rate</strong> um<br />
exp(β 3 ) ∆x = exp(0.2255) 5 = 3.08, bzw. [exp(0.2255) 5 – 1 ] * 100% = 208%<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 4
Zwei Varianten von Signifikanztests für die Regressionskoeffizienten:<br />
1.) T-Test, woher kommt σσσσ ? Diagonalelemente von H ˆ −1<br />
( − ) / n<br />
ˆ βk<br />
t =<br />
ˆ σ ( ˆ βk<br />
)<br />
Hˆ<br />
2 ⎡ ∂ l<br />
⎢ 2<br />
⎢<br />
∂x<br />
1<br />
= ⎢ .<br />
2 ⎢ ∂ l<br />
⎢<br />
⎣ ∂x<br />
k ∂x<br />
1<br />
...<br />
...<br />
2<br />
∂ l ⎤<br />
⎥<br />
∂x<br />
1 ∂x<br />
k ⎥<br />
. ⎥<br />
2<br />
∂ l ⎥<br />
2 ⎥<br />
∂x<br />
k ⎦<br />
2. Ableitungen:<br />
„Steigung der<br />
Steigung“ der Log-<br />
Likelihoodfunktion<br />
für den jeweiligen<br />
2.) Likelihood- Ratio Test (LR-Test)<br />
Parameter<br />
Vergleich der Log-Likelihood des Modells mit Referenzmodell<br />
LL 1 : Referenzmodell: r = exp(β 0 + β 1 x 1 )<br />
LL 2 : um β 2 x 2 erweitert: r = exp (β 0 + β 1 x 1 + β 2 x 2 )<br />
Oder:<br />
LL 0 Referenzmodell: r = exp(β 0 ) „Nullmodell“<br />
LL 2 Erweitertes Modell: r = exp (β 0 + β 1 x 1 + β 2 x 2 )<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 5
Vergleich der Log-Likelihood-Werte zweier Modelle führt zu<br />
Likelihood-Ratio Test (LR), der annäherungsweise χ 2 verteilt ist:<br />
χ 2 =2 * [ LL 1 –LL 0 ] df=Zahl der neuen Parameter<br />
χ 2 =2 * [ LL(aktuelles Modell) – LL(Referenzmodell) ]<br />
a) Aktuelles Modell enthält gegenüber dem Referenzmodell eine<br />
erklärende Variable <strong>und</strong> einen Parameter mehr. Information<br />
entspricht T-Test. Bei kleinen Fallzahlen hat LR-Test Priorität!<br />
Oder Gruppe von Variablen (z.B. Dummies für Kohorten)<br />
b) Aktuelles Modell mit k erklärenden Variablen ist Ihr „bestes“.<br />
Passt das Gesamtmodell signifikant besser zu den Daten als<br />
Modell ohne Kovariaten? χ 2 - Test analog zum F-Test der<br />
Signifikanz des R 2 in OLS Regression.<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 6
Beispiel: <strong>Rate</strong> des Verlassens der Arbeitsstelle (exp1.cf)<br />
Referenzmodell:<br />
Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />
-------------------------------------------------------------------<br />
1 1 0 1 A Constant -5.1123 0.2442 -20.9327 1.0000<br />
2 1 0 1 A Frau 0.5969 0.0948 6.2950 1.0000<br />
3 1 0 1 A EDU 0.0348 0.0205 1.6958 0.9101<br />
Log likelihood (starting values): -2514.0201<br />
Log likelihood (final estimates): -2494.4869<br />
aktuelles Modell: Variable Lfx wird eingeführt<br />
Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />
-------------------------------------------------------------------<br />
1 1 0 1 A Constant -4.8284 0.2530 -19.0815 1.0000<br />
2 1 0 1 A Frau 0.5236 0.0957 5.4694 1.0000<br />
3 1 0 1 A EDU 0.0294 0.0208 1.4087 0.8411<br />
4 1 0 1 A Lfx -0.0038 0.0008 -4.7709 1.0000<br />
Log likelihood (starting values): -2514.0201<br />
Log likelihood (final estimates): -2481.2854<br />
χ 2 =2 * [ LL(aktuelles Modell) – LL(Referenzmodell) ]<br />
χ 2 =2*[ -2481,28 - (-2494,48) ]=2*13,2=26,4 (df=1), 1- p=0.9906<br />
automatisiert: lr_test.cf<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 7
Ereignisanalyse: Exponentialmodell<br />
Modellvarianten, nicht nur für Exponentialmodell: exp1.cf<br />
1.) Ein Zielzustand, eine Episode pro Person<br />
2.) Ein Zielzustand, mehrere Episoden pro Person<br />
3.) Ein Zielzustand, mehrere Episoden pro Person, Effekte für jeden<br />
Übergang separat geschätzt<br />
4.) Mehrere Zielzustände: competing risk models<br />
dblock=ID,<br />
Lfx=cum(Dur)-Dur,<br />
# Vorgeschichte<br />
Ep_1=SN - 1,<br />
1. Aufgabenblatt, auch mit pre<br />
Anzahl der vorangegangenen Episoden<br />
# Kovariate: Effekt von Lfx fuer beide Geschlechter<br />
# Interaktionsterm<br />
Lfx_fr=Frau[1]*Lfx,<br />
Interaktionsterm<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 8
Ereignisanalyse: Exponentialmodell<br />
edef(<br />
org=0,<br />
des=DES,<br />
Definition der Episodendaten → bekannt!<br />
ts=0,<br />
tf=Dur,<br />
);<br />
# Regressionsmodell: <strong>Rate</strong> von Geschlecht abhängig<br />
rate(<br />
xa(0,1)=Frau, # x-Vektor auf den a-Term<br />
rrisk, # relative Risiken, exp(beta)<br />
)=2; # 2=exponential model<br />
# Regressionsmodell: <strong>Rate</strong> von Geschlecht abhängig,<br />
# unter Kontrolle des Ausbildungsniveaus ("highest")<br />
rate(<br />
xa(0,1)=Frau,EDU,<br />
rrisk,<br />
)=2;<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 9
Ereignisanalyse: Exponentialmodell<br />
Mehrere Episoden pro Person:<br />
• Problem: Episoden sind nicht unabhängig voneinander.<br />
• Lösungsansatz 1.) : Kontrolle der Vorgeschichte, hier:<br />
Berufserfahrung <strong>und</strong> Zahl der vorangegangenen Episoden.<br />
• Lösungsansatz 2.) : separate Modellierung der Übergänge<br />
rate(<br />
xa(0,1)=Frau,EDU,Lfx,<br />
rrisk,<br />
)=2;<br />
rate(<br />
xa(0,1)=Frau,EDU,Lfx,Ep_1,<br />
rrisk,<br />
)=2;<br />
1.) Kontrolle der Vorgeschichte<br />
Berufserfahrung<br />
Anzahl der vorangegangenen Episoden. Problem:<br />
was misst diese Variable genau? Zumindest Kontrolle<br />
„unbeobachteter Heterogenität“, die mit häufigem<br />
Wechseln korreliert.<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 10
Ereignisanalyse: Exponentialmodell<br />
2.) separate Modellierung der einzelnen Übergänge<br />
edef(<br />
org=0,<br />
des=DES,<br />
ts=0,<br />
tf=Dur,<br />
id=ID,<br />
sn=SN, # Mehrepisodenfall,<br />
);<br />
• wenn SN nicht vorhanden, Variable bilden mit:<br />
dblock=ID,<br />
SN=brec,<br />
• Problem des Ansatzes: schwindende Fallzahlen mit steigender<br />
Episodennummer. Begrenzung auf „die ersten Episoden“ wiederum<br />
problematisch, da „Mover“ zu gering vertreten sind.<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 11
Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />
Idx SN Org Des MT Variable Coeff Error C/Error Signif<br />
-------------------------------------------------------------------<br />
1 1 0 1 A Constant -4.7610 0.2541 -18.7397 1.0000<br />
2 1 0 1 A Frau 0.3834 0.1166 3.2884 0.9990<br />
3 1 0 1 A EDU 0.0289 0.0208 1.3869 0.8345<br />
4 1 0 1 A Lfx -0.0051 0.0011 -4.8416 1.0000<br />
5 1 0 1 A Lfx_fr 0.0034 0.0016 2.1305 0.9669<br />
Regressionsmodell, allgemeine Darstellung:<br />
y=b ^<br />
0+b1x1+...+bnxn Regressionsmodell mit Interaktion Berufserfahrung x Frau:<br />
r(t)=exp(-4.76+0.3834*Frau+0.0289*EDU<br />
-0.0051*Lfx+0.0034*Lfx_fr)<br />
b(Lfx) =Effekt für Männer<br />
b(Lfx)+b(Lfx_fr) =Effekt für Frauen<br />
Resultat:<br />
Effekt für Männer negativ. Effekt für Frauen auch, jedoch weniger<br />
stark. Berufserfahrung wirkt sich für Frauen also weniger<br />
stabilisierend aus, als für Männer<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 12
Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />
Wichtig: anschauliche Darstellung der empirischen Bef<strong>und</strong>e<br />
• Ereignisanalytisches Regressionsmodell: wenig anschaulich,<br />
zumal mit Interaktionseffekt<br />
• <strong>Survivorfunktion</strong>: einfach, sehr anschaulich<br />
Anhand der geschätzten Parameter können <strong>Survivorfunktion</strong>en für<br />
spezifische Merkmalskonstellationen berechnet werden.<br />
→prate-Option im Rahmen des rate- Befehls<br />
liefert für jeden gewählten Zeitpunkt G(t), f(t) <strong>und</strong> r(t)<br />
Ergebnis wird grafisch dargestellt<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 13
Anteil noch im Job<br />
Abb. 1: Einfluss der Berufserfahrung auf die<br />
Beschäftigungsstabilität, getrennt nach Geschlecht<br />
1,0<br />
,9<br />
,8<br />
,7<br />
,6<br />
,5<br />
,4<br />
,3<br />
,2<br />
,1<br />
0,0<br />
0<br />
2<br />
Lfx Lfx=60 Lfx Lfx =60 Monate<br />
Monate<br />
Lfx Lfx=24 Lfx =24 Monate<br />
Monate<br />
4<br />
6<br />
8<br />
10<br />
12<br />
14<br />
16<br />
18<br />
20<br />
22<br />
24<br />
Prozesszeit in Monaten<br />
Quelle: MPI-Lebensverlaufsstudie, eigene Berechungen<br />
26<br />
28<br />
30<br />
32<br />
34<br />
36<br />
Männer<br />
Männer<br />
Frauen<br />
Frauen<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 14
Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />
prate: berechne auf Basis der im Modell geschätzten Koeffizienten<br />
(Regressionsgleichung) die <strong>Rate</strong> über die Zeitachse hinweg. Und zwar<br />
für bestimmte Merkmalskombinationen, die gerade von Interesse sind.<br />
Hier: Interaktion Frau ×××× Lfx<br />
rate(<br />
xa(0,1)=Frau,EDU,Lfx,Lfx_fr,<br />
rrisk,<br />
# Frauen, 2 Jahre Berufserfahrung<br />
prate(tab=0(1)36,Frau=1,EDU=12,Lfx=24,Lfx_fr=24)=Frau24.t,<br />
# Maenner, 2 Jahre Berufserfahrung<br />
prate(tab=0(1)36,Frau=0,EDU=12,Lfx=24,Lfx_fr=0)=Mann24.t,<br />
# Frauen, 5 Jahre Berufserfahrung<br />
prate(tab=0(1)36,Frau=1,EDU=12,Lfx=60,Lfx_fr=60)=Frau60.t,<br />
# Maenner, 5 Jahre Berufserfahrung<br />
prate(tab=0(1)36,Frau=0,EDU=12,Lfx=60,Lfx_fr=0)=Mann60.t,<br />
)=2;<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 15
Ereignisanalyse: Exponentialmodell, Interaktionseffekt<br />
„trivial“ matching: Zusammenführen der Datensätze durch<br />
einfaches nebeneinander legen. Hier ausreichend, weil die<br />
Zeitachse für jede Matrix identisch ist.<br />
Frau24.t Frau60.t Mann24.t Mann60.t<br />
0 1<br />
1 0.99<br />
2 0.96<br />
3 0.91<br />
. .<br />
. .<br />
36 0.57<br />
0 1<br />
1 0.99<br />
2 0.98<br />
3 0.97<br />
. .<br />
. .<br />
36 0.60<br />
0 1<br />
1 0.99<br />
2 0.98<br />
3 0.98<br />
. .<br />
. .<br />
36 0.74<br />
0 1<br />
1 0.99<br />
2 0.99<br />
3 0.99<br />
.<br />
.<br />
36 0.80<br />
Dann wird<br />
Datensatz in SPSS<br />
eingelesen <strong>und</strong><br />
Grafik erstellt mit:<br />
g_interaktion.sps<br />
4 Datensätze werden zu einem Datensatz verb<strong>und</strong>en <strong>und</strong><br />
herausgeschrieben, weil clear; Befehl fehlt<br />
M. Windzio: Ereignisanalyse WS 03-04 , Folie Nr. 16