Introduktion til overlevelsesanalyse - Cox regression III
Introduktion til overlevelsesanalyse - Cox regression III
Introduktion til overlevelsesanalyse - Cox regression III
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Faculty of Health Sciences<br />
<strong>Introduktion</strong> <strong>til</strong> <strong>overlevelsesanalyse</strong><br />
<strong>Cox</strong> <strong>regression</strong> <strong>III</strong><br />
Susanne Rosthøj<br />
Biostatistisk Afdeling<br />
Institut for Folkesundhedsvidenskab<br />
Københavns Universitet<br />
sr@biostat.ku.dk<br />
Kursushjemmeside:<br />
www.biostat.ku.dk/~sr/forskningsaar/survival2011
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Program for dag 4<br />
• Repetition to kategoriske variable:<br />
Den additive model<br />
Interaktion<br />
En kontinuert variabel<br />
• Interaktion mellem en kategorisk og en kontinuert variabel<br />
• Forsinket indgang<br />
• Proportional hazards antagelsen<br />
Stratificering<br />
Modelkontrol : Simple grafiske metoder<br />
• Gennemgående eksempel:<br />
• Leukæmi patienter i remission.<br />
Dagens gennemgang svarer <strong>til</strong> Kleinbaum & Klein rest kapitel<br />
3, kapitel 4 (I-V) og kapitel 5.<br />
2 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
To kategoriske variable<br />
Vi ønsker at beskrive effekten af behandling justeret for<br />
(kategoriseret) logWBC. <strong>Cox</strong> modellen bliver<br />
⎧<br />
1 placebo, logWBC i < 2.37<br />
exp(β 2 ) placebo, logWBC i ∈ [2.37; 3.23)<br />
⎪⎨ exp(β 3 ) placebo, logWBC i ≥ 3.23.<br />
λ i (t) = λ 0 (t)<br />
exp(β 1 ) behandling, logWBC i < 2.37<br />
exp(β 1 + β 2 ) behandling, logWBC i ∈ [2.37; 3.23)<br />
⎪⎩<br />
exp(β 1 + β 3 ) behandling, logWBC i ≥ 3.23.<br />
= λ 0 (t) exp(β 1 behandling i + β 2 {WBC-grp 2} i + β 3 {WBC-grp 3} i )<br />
Fortolkning af <strong>regression</strong>sparametrene:<br />
• exp(β 1 ) er HR for behandling vs placebo for fastholdt WBC.<br />
• exp(β 2 ) er HR for WBC-gruppe 2 vs WBC-gruppe 1 for fastholdt<br />
behandling. Tilsvarende for exp(β 3 ).<br />
3 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Den additive model<br />
Vi kan illustrere modellen i følgende tabel på<br />
log-hazard-skalaen:<br />
Kategoriseret logWBC<br />
Z = 1 Z = 2 Z = 3<br />
Placebo 0 β 2 β 3<br />
Behandling β 1 β 1 + β 2 β 1 + β 3<br />
Forskellen mellem placebo og behandling er den samme for<br />
hvert niveau af logWBC-gruppe.<br />
Forskellen mellem logWBC-grupperne er den samme for hver<br />
behandlingsgruppe.<br />
Denne model kaldes også den additive model.<br />
4 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Interaktion mellem kategoriske variable<br />
Den additive model<br />
Kategoriseret logWBC<br />
Z = 1 Z = 2 Z = 3<br />
Placebo 0 β 2 β 3<br />
Behandling β 1 β 1 + β 2 β 1 + β 3<br />
forudsætter, at der ikke er interaktion (vekselvirkning).<br />
Interaktionsmodellen <strong>til</strong>lader at effekten af behandling<br />
afhænger af logWBC:<br />
Kategoriseret logWBC<br />
Z = 1 Z = 2 Z = 3<br />
Placebo 0 β 2 β 3<br />
Behandling β 1 β 1 + β 2 + β 4 β 1 + β 3 + β 5<br />
dvs. en model hvor parametrene varierer fuldstændigt frit.<br />
5 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
En kontinuert forklarende variabel<br />
<strong>Cox</strong>-modellen med WBC som kontinuert forklarende variabel er<br />
λ i (t) = λ 0 (t) exp(βWBC i ).<br />
Sammenlignes to patienter med en forskel på 1 i WBC, når det<br />
laveste er referencen, fås<br />
HR = λ 0(t) exp(β(WBC + 1)<br />
λ 0 (t) exp(βWBC)<br />
= exp(β).<br />
Dvs fortolkningen er : for hver gang WBC øges med 1,<br />
skal HR ganges med exp(β).<br />
6 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Log-hazard for en kontinuert variabel<br />
<strong>Cox</strong>-modellen på log-hazard-skala lyder<br />
log(λ i (t)) = log(λ 0 (t)) + βWBC i<br />
dvs. effekten af WBC er lineær på log-hazard-funktionen:<br />
baseline<br />
log−hazard<br />
0 2 4 6 8 10<br />
0 50 100 150<br />
WBC<br />
7 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
logWBC som forklarende variabel<br />
Sidst nåede vi frem <strong>til</strong> <strong>Cox</strong> modellen som inkluderer WBC på<br />
log-skala. Vi fandt:<br />
> cox10 summary(cox10)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ logWBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
logWBC 1.646 5.189 0.298 5.525 3.29e-08 ***<br />
---<br />
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />
exp(coef) exp(-coef) lower .95 upper .95<br />
logWBC 5.188 0.1927 2.893 9.304<br />
Concordance= 0.809 (se = 0.062 )<br />
Rsquare= 0.564 (max possible= 0.988 )<br />
Likelihood ratio test= 34.84 on 1 df, p=3.577e-09<br />
Wald test = 30.53 on 1 df, p=3.294e-08<br />
Score (logrank) test = 36.62 on 1 df, p=1.433e-09<br />
8 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Fortolkning af effekten af WBC på log-skala<br />
HR øges med en faktor 5.189 for hver gang logWBC øges med 1.<br />
Hvad betyder det<br />
det vil sige at<br />
1 = log(WBC 1 ) − log(WBC 2 )<br />
= log( WBC 1<br />
WBC 2<br />
)<br />
WBC 1<br />
WBC 2<br />
= exp(1) = 2.72.<br />
Dermed er fortolkningen, at HR øges med en faktor 5.189 for hver<br />
gang WBC øges med en faktor 2.72.<br />
Løsning: Brug logaritme med base 2 i stedet.<br />
9 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
<strong>Cox</strong>-modellen med log 2 (WBC)<br />
> log2WBC cox11 summary(cox11)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ log2WBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
log2WBC 1.1412 3.1306 0.2066 5.525 3.29e-08 ***<br />
---<br />
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />
exp(coef) exp(-coef) lower .95 upper .95<br />
log2WBC 3.131 0.3194 2.088 4.693<br />
Concordance= 0.809 (se = 0.062 )<br />
Rsquare= 0.564 (max possible= 0.988 )<br />
Likelihood ratio test= 34.84 on 1 df, p=3.577e-09<br />
Wald test = 30.53 on 1 df, p=3.294e-08<br />
Score (logrank) test = 36.62 on 1 df, p=1.433e-09<br />
Ved en fordobling af WBC øges HR med en faktor 3.13 (95% KI<br />
2.09-4.69). Eller : risikoen for <strong>til</strong>bagefald mere end 3-dobles<br />
ved en fordobling af WBC.<br />
Bemærk at teststørrelserne og p-værdierne er uændrede.<br />
10 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
En binær og en kontinuert forklarende variabel<br />
Vi kan nu vurdere effekten af behandling justeret for log 2 WBC.<br />
Modellen lyder på log-hazard skalaen<br />
log(λ i (t)) = log(λ 0 (t)) + β 1 behandling i + β 2 log 2 (WBC i )<br />
dvs. effekten af log 2 WBC er lineær på log-hazard-funktionen, men vi<br />
<strong>til</strong>lader forskelligt niveau (intercept) afhængigt af behandlingsgruppe:<br />
baseline<br />
log−hazard<br />
0 2 4 6 8<br />
Placebo<br />
Behandling<br />
0 2 4 6 8<br />
log2WBC<br />
11 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
En binær og en kontinuert forklarende variabel i R<br />
> treatment cox12 summary(cox12)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
factor(treatment)1 -1.3861 0.2501 0.4248 -3.263 0.0011 **<br />
log2WBC 1.1720 3.2286 0.2328 5.034 4.8e-07 ***<br />
---<br />
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />
exp(coef) exp(-coef) lower .95 upper .95<br />
factor(treatment)1 0.2501 3.9991 0.1088 0.5749<br />
log2WBC 3.2286 0.3097 2.0456 5.0955<br />
Concordance= 0.852 (se = 0.062 )<br />
Rsquare= 0.671 (max possible= 0.988 )<br />
Likelihood ratio test= 46.71 on 2 df, p=7.187e-11<br />
Wald test = 33.6 on 2 df, p=5.061e-08<br />
Score (logrank) test = 46.07 on 2 df, p=9.921e-11<br />
12 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Interaktion mellem binær og kontinuert variabel<br />
Interaktionsmodellen lyder (med placebo som baseline)<br />
λ i (t) =<br />
{<br />
λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />
λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo<br />
svarende <strong>til</strong> at vi har to ikke-parallelle linier på<br />
log-hazard-skalaen:<br />
baseline<br />
log−hazard<br />
0 2 4 6 8<br />
Placebo<br />
Behandling<br />
0 2 4 6 8<br />
log2WBC<br />
13 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Fortolkning af interaktionen<br />
λ i (t) =<br />
{<br />
λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />
λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo<br />
I denne model er HR for<br />
• behandling vs placebo:<br />
exp(β 1+β 2log 2 WBC)<br />
exp(β 3log 2 WBC)<br />
• log 2 WBC+1 vs log 2 WBC:<br />
exp(β 1+β 2(log 2 WBC+1))<br />
exp(β 1+β 2log 2 WBC)<br />
exp(β 3(log 2 WBC+1))<br />
exp(β 3log 2 WBC)<br />
= exp(β 1 + (β 2 − β 3 )log 2 WBC)<br />
= exp(β 2 ) hvis behandlet<br />
= exp(β 3 ) hvis placebo.<br />
Dvs:<br />
Effekten af behandling afhænger af WBC. Effekten af WBC<br />
afhænger af behandlingsgruppe.<br />
14 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Interaktion mellem binær og kontinuert variabel<br />
I interaktionsmodellen<br />
λ i (t) =<br />
{<br />
λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />
λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo (1)<br />
lyder hypotesen om manglende interaktion<br />
H 0 : β 2 = β 3 .<br />
Vi kan omparameterisere modellen <strong>til</strong><br />
λ i (t) =<br />
{<br />
λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />
λ 0 (t) exp( (β 2 + ˜β 3 ) log 2 WBC i ) hvis i får placebo (2)<br />
hvorved hypotesen lyder<br />
H 0 : ˜β 3 = 0.<br />
15 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Illustration af interaktion vs den additive model<br />
baseline<br />
log−hazard<br />
−2 0 2 4 6<br />
Placebo<br />
Behandling<br />
Placebo H_0<br />
Behandling H_0<br />
0 1 2 3 4 5<br />
logWBC<br />
På log-hazard-skalaen svarer manglende interaktion (H 0 ) <strong>til</strong><br />
parallelle linier.<br />
16 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Interaktionsmodellen i R<br />
Model (1):<br />
> cox13 summary(cox13)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ factor(treatment) + factor(treatment):log2WBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
factor(treatment)1 -2.37491 0.09302 1.70547 -1.393 0.164<br />
factor(treatment)0:log2WBC 1.07777 2.93812 0.27633 3.900 9.61e-05 ***<br />
factor(treatment)1:log2WBC 1.29786 3.66145 0.31289 4.148 3.35e-05 ***<br />
---<br />
Model (2):<br />
> cox14 summary(cox14)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC +<br />
factor(treatment) * log2WBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
factor(treatment)1 -2.37491 0.09302 1.70547 -1.393 0.164<br />
log2WBC 1.07777 2.93812 0.27633 3.900 9.61e-05 ***<br />
factor(treatment)1:log2WBC 0.22009 1.24619 0.36445 0.604 0.546<br />
---<br />
17 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Flere variable<br />
Vi kan vurdere effekten af behandling justeret for køn og<br />
logWBC:<br />
> cox15 summary(cox15)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC +<br />
factor(female))<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
factor(treatment)1 -1.5036 0.2223 0.4615 -3.258 0.00112 **<br />
log2WBC 1.1658 3.2086 0.2333 4.997 5.82e-07 ***<br />
factor(female)1 0.3147 1.3698 0.4545 0.692 0.48872<br />
---<br />
Hvad er baselinegruppen i denne model<br />
Hvilken model skal vi vælge som den endelige model<br />
18 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Forsinket indgang<br />
Kun de individer, for hvilken en hændelse er indtruffet, bliver<br />
observeret.<br />
Eksempel: Vedligeholdelsesbehandling af børn med leukæmi.<br />
0 Start VB<br />
◦ • ✲<br />
Tid 0 er diagnosedatoen, men patienterne starter ikke<br />
vedligeholdelsesbehandlingen samtidigt.<br />
19 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Illustration af forsinket indgang<br />
Vedligeholdelsesbehandling af ALL<br />
Patient<br />
1 2 3 4 5 6 7 8 9 10<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
365 730 1095<br />
År siden diagnose<br />
20 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Håndtering af forsinket indgang<br />
For hvert dødstidspunkt t i holdes øje med risikomængden R(t i )<br />
(mængden af patienter under risiko for død umiddelbart før t i ).<br />
Udtrykket for den partielle likelihood for <strong>Cox</strong>-modellen er<br />
uændret<br />
L(β) =<br />
k∏<br />
i=1<br />
exp(βX i )<br />
∑j∈R(t i ) exp(βX j) ,<br />
men forskellen er, at patienterne <strong>til</strong>lades at træde ind og ikke<br />
kun ud af studiet på forskellige tidspunkter.<br />
Tilsvarende for Kaplan-Meier-estimatoren.<br />
Forsinket indgang er let at styre i R, idet vi definerer vores<br />
respons ved: Surv(indgang,udgang,event).<br />
21 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
<strong>Cox</strong> modellens antagelser<br />
Den generelle <strong>Cox</strong> model er<br />
λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + · · · + β p X ip )<br />
når vi inkluderer p forklarende variable i modellen.<br />
Antagelserne er<br />
1) effekten af de forklarende variable er additiv og lineær på<br />
log-hazard-skalaen<br />
2) kun baseline hazard afhænger af tiden t, dvs. at den<br />
relative risiko imellem to individer er konstant over tid<br />
(proportional hazards).<br />
Vi er nødt <strong>til</strong> at kontrollere om disse antagelser er rimelige.<br />
Sidst så vi på 1) og vi vil nu gå videre med 2).<br />
22 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Proportionale hazards med én forklarende variabel<br />
For <strong>Cox</strong>-modellen indeholdende én forklarende variabel<br />
λ i (t) = λ 0 (t) exp(βI(patient i behandlet))<br />
er proportionalitetsantagelsen at hazard ratio for i behandlet vs<br />
j placebo<br />
λ i (t)<br />
λ j (t)<br />
= exp(β)<br />
ikke afhænger af tiden t dvs. at<br />
λ i (t)<br />
λ j (t)<br />
med mindre f er en konstant.<br />
≠<br />
f (t)<br />
23 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
PH med flere forklarende variable<br />
For den generelle <strong>Cox</strong>-model indeholdende flere forklarende<br />
variable<br />
λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + . . . + β p X ip )<br />
er proportionalitetsantagelsen at hazard ratio mellem individ i<br />
og j er konstant<br />
λ i (t)<br />
λ j (t)<br />
= exp(β 1 (X i1 − X j1 ) + . . . + β p (X ip − X jp )),<br />
dvs. ikke afhænger af tiden t.<br />
Bemærk at dette svarer <strong>til</strong> at vi skal have PH mellem grupper<br />
for de kategoriske variable.<br />
24 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Et eksempel på en stratificeret model<br />
Vedligeholdelsesbehandling af børn med ALL, stratificeret på<br />
risikogruppe.<br />
Intermediær risiko<br />
Standard risiko<br />
hazard rate<br />
−2 −1 0 1 2 3 4 5 6<br />
År siden ophør af vedligeholdelsesbehandling<br />
25 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Hvorfor bekymre sig om PH-antagelsen<br />
Det er vigtigt at undersøge proportionalitetsantagelsen:<br />
• Hvis PH ikke er opfyldt vil estimatet fra <strong>Cox</strong> <strong>regression</strong>en<br />
være en gennemsnitlig effekt over tid.<br />
• Hvis vi ikke tager højde for en eventuel tidsafhængig effekt<br />
kan der opstå bias for nogle af de øvrige estimerede<br />
effekter i modellen.<br />
• Det kan være vigtigt at forstå, hvordan effekten varierer<br />
over tid, idet det kan gøre os klogere på de mekanismer,<br />
som genererer data.<br />
• I nogle sammenhænge kan den gennemsnitlige effekt dog<br />
være en interessant / acceptabel beskrivelse af effekten -<br />
men det er vigtigt at kende <strong>til</strong> konkvenserne af at ignorere<br />
en tidsafhængig effekt.<br />
26 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Manglende PH med en forklarende variabel<br />
Når <strong>Cox</strong>-modellen indeholdende én forklarende variabel<br />
λ i (t) =<br />
{<br />
λ0 (t) hvis i får placebo<br />
λ 0 (t) exp(β) hvis i får behandling<br />
ikke er rimelig er en mulighed at lade hazarden variere<br />
fuldstændigt frit i hver kategori<br />
λ i (t) =<br />
{<br />
λ01 (t) hvis i får placebo<br />
λ 02 (t) hvis i får behandling<br />
Vi har nu ingen model og må estimere hazarden (snarere<br />
overlevelseskurverne) vha Kaplan-Meier metoden.<br />
Kategorierne kaldes nu for strata (ental: stratum).<br />
27 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Manglende PH med to forklarende variable<br />
<strong>Cox</strong>-modellen med behandling og log 2 WBC lyder<br />
λ i (t) = λ 0 (t) exp(β 1 I(patient i behandlet) + β 2 log 2 WBC i ).<br />
Antag at PH kun er opfyldt for log 2 WBC, dvs at<br />
λ i (t)<br />
λ j (t)<br />
= exp(β 2 (log 2 WBC i − log 2 WBC j ))<br />
for fastholdt behandlingsgruppe mens<br />
λ i (t)<br />
λ j (t)<br />
= f (t) ≠ exp(β 1 ).<br />
for fastholdt WBC.<br />
En mulig løsning er at stratificere på behandlingsgruppe:<br />
28 / 44<br />
λ i (t) =<br />
{<br />
λ01 (t) exp(β log 2 (WBC)) hvis i får placebo<br />
λ 02 (t) exp(β log 2 (WBC)) hvis i får behandling
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Stratificering<br />
Den generelle stratificerede model lyder<br />
λ i (t) = λ 0k (t) exp(β 1 X i1 + · · · β p X ip )<br />
hvor hvert strata k = 1, . . . , K har sin egen baseline hazard.<br />
Bemærk at der ikke er interaktion mellem strata-variablen og de<br />
øvrige variable (bør undersøges).<br />
Fordele og ulemper ved stratificering:<br />
29 / 44<br />
• Nyttigt når vi er nødt <strong>til</strong> at inkludere ’nuisance’ variable i<br />
modellen og er ligeglade med at beskrive effekten af<br />
variablene.<br />
• Ikke hensigtsmæssigt hvis variablen er af primær interesse<br />
(eg. behandling).<br />
• Vi kan ikke teste om strata-variablen har en effekt på<br />
overlevelsen.
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Den stratificerede <strong>Cox</strong>-model i R<br />
I R angives en strata-variabel vha strata:<br />
> cox14 summary(cox14)<br />
Call:<br />
coxph(formula = Surv(time, event) ~ strata(treatment) + log2WBC)<br />
n= 42, number of events= 30<br />
coef exp(coef) se(coef) z Pr(>|z|)<br />
log2WBC 1.0514 2.8616 0.2226 4.723 2.32e-06 ***<br />
---<br />
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1<br />
exp(coef) exp(-coef) lower .95 upper .95<br />
log2WBC 2.862 0.3495 1.85 4.427<br />
Concordance= 0.814 (se = 0.098 )<br />
Rsquare= 0.467 (max possible= 0.962 )<br />
Likelihood ratio test= 26.45 on 1 df, p=2.71e-07<br />
Wald test = 22.31 on 1 df, p=2.32e-06<br />
Score (logrank) test = 26.15 on 1 df, p=3.152e-07<br />
30 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Simpel grafisk modelkontrol<br />
Observeret (KM) vs forventet (<strong>Cox</strong>) overlevelse:<br />
Behandling<br />
Grupperet WBC<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 5 10 15 20 25 30 35<br />
0 5 10 15 20 25 30 35<br />
Køn<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
OBS!<br />
0 5 10 15 20 25 30 35<br />
Jævnfør øvelserne dag 2.<br />
31 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Grafisk modelkontrol via log(-log(overlevelse))<br />
For <strong>Cox</strong>-modellen er overlevelseskurven givet den forklarende<br />
variabel X i = I(patient i behandlet)<br />
{<br />
S(t | X i ) = S 0 (t) exp(βX i) S0 (t)<br />
=<br />
exp(β) hvis i får behandling<br />
S 0 (t) hvis i får placebo.<br />
Det betyder at<br />
log(− log(S(t | X i ))) = log(− log(S 0 (t))) + βX i<br />
svarende <strong>til</strong> at differensen<br />
log(− log(S(t | X i ))) − log(− log(S(t | X j ))) = β(X i − X j )<br />
mellem to individer i og j ikke afhænger af tiden t, dvs at<br />
overlevelseskurverne er parallelle som funktion af t.<br />
log(-log(·))-funktionen kaldes også for cloglog-funktionen.<br />
32 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
cloglog-kurver for kategoriske variable<br />
Med kategoriske forklarende variable kan vi estimere<br />
overlevelseskurven for hvert niveau af variablen ved<br />
Kaplan-Meier-kurven og plotte log(-log(S))-kurverne i ét plot:<br />
Behandling<br />
logWBC<br />
−2.0 −1.0 0.0 1.0<br />
Placebo<br />
Behandling<br />
−2.5 −1.5 −0.5 0.5<br />
Lav<br />
Mellem<br />
Høj<br />
1 2 5 10 20<br />
1 2 5 10 20<br />
Køn<br />
−3.0 −2.0 −1.0 0.0<br />
Mand<br />
Kvinde<br />
OBS!<br />
Bemærk log-skala<br />
på x-aksen (default i R).<br />
1 2 5 10 20<br />
33 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Simultan evaluering af PH-antagelsen<br />
Vi bør evaluere PH-antagelsen simultant (samtidigt) når vi har<br />
flere forklarende variable.<br />
Kategoriser de kontinuerte og se på cloglog-kurverne for alle<br />
kombinationer af de forklarende variable:<br />
−2.0 −1.0 0.0<br />
1 2 5 10 20<br />
Uoverskueligt med flere variable.<br />
Nogle strata har meget få events, hvorfor det bliver svært at<br />
sammenligne kurverne.<br />
34 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Simultan evaluering af PH vha <strong>Cox</strong>-modellen<br />
Vi kan kontrollere PH-antagelsen for én variabel i en <strong>Cox</strong><br />
model, hvor vi har justeret for de øvrige variable:<br />
1) Stratificér <strong>Cox</strong>-modellen på variablen, for hvilken PH skal<br />
kontrolleres.<br />
2) Estimér de justerede overlevelseskurver for hvert stratum.<br />
Disse afhænger af de øvrige kovariatværdier → vælg<br />
eventuelt gennemsnitlige / median værdier.<br />
3) Plot cloglog-kurver for hvert stratum som funktion af t (evt<br />
log(t)) og vurdér om linierne er parallelle.<br />
Udfør 1)-3) for alle variablene. Derved kan vi vurdere, om der<br />
skal stratificeres på en eller flere variable.<br />
35 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Justerede cloglog-kurver i R<br />
Vi vil vurdere PH for køn i remissionsdata. Den stratificerede<br />
model inkluderende alle variable lyder:<br />
λ i (t) =<br />
{<br />
λ01 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er mand<br />
λ 02 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er kvinde.<br />
hvor beh i =1 hvis i er behandlet, 0 ellers.<br />
I R fittes modellen, overlevelseskurverne bestemmes og<br />
cloglog-kurverne plottes med:<br />
cox15
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Proportionalitetsantagelsen for køn er stadig ikke opfyldt:<br />
−3 −2 −1 0 1<br />
1 2 5 10 20<br />
37 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Mulige løsninger på manglende PH<br />
Der kan tages højde for afvigelse fra PH-antagelsen på<br />
følgende måder:<br />
1) Stratificering.<br />
2) Benyt en anden model (e.g. Accelerated Failure Time,<br />
additiv hazard model).<br />
3) Inddeling af tidsaksen. Måske holder PH-antagelsen over<br />
mindre tidsintervaller. Lav separate analyser.<br />
38 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
4) Vi kan acceptere <strong>Cox</strong>-modellen med en tidsafhængig effekt<br />
λ i (t) = λ 0 (t) exp(β(t)X i )<br />
og forsøge at beskrive denne effekt ved at <strong>til</strong>føje en<br />
tidsafhængig version af X. F.eks. kan vi formulere en<br />
tidsafhængig effekt ved<br />
β 1 X 1 + β 2 X 2 (t) =<br />
{<br />
β1 X 1 t < 1 år<br />
(β 1 + β 2 )X 1 t ≥ 1 år<br />
hvor X 2 (t) = X 1 I(t ≥ 1 år) er den tidsafhængige variabel.<br />
39 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
4) Fortsat:<br />
Måske øges / reduceres effekten lineært med tiden<br />
svarende <strong>til</strong> modellen<br />
λ i (t) = λ 0 (t) exp(β(t)X i ) = λ 0 (t) exp((β 1 + β 2 t)X i )<br />
som kan beskrives vha. den tidsafhængige variabel<br />
X 2 (t) = t × X<br />
β 1 X + β 2 X 2 (t) = β 1 X + β 2 tX = (β 1 + β 2 t)X.<br />
For at kunne formulere en sådan model er vi nødt <strong>til</strong> at<br />
undersøge hvordan den tidsafhængige effekt ser ud. (Vi<br />
undersøger dette næste gang vha. residualer).<br />
Håndteringen af tidsafhængige variable i R kræver lidt<br />
programmering (men er principielt simpelt nok).<br />
Se KK kapitel 6.<br />
40 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Øvelser<br />
PBC-data (Primary Biliary Cirrhosis).<br />
Vi vil her forsøge at beskrive risikoen for død (status=2) vha<br />
følgende forklarende variable:<br />
Alder, køn, edema, bilirubin, prothrombin time, albumin.<br />
1) Aktivér datasættet pbc i survival-pakken. Find eventuelt<br />
beskrivelser af dette datasæt ved at søge på nettet.<br />
2) Formulér en passende model:<br />
Overvej i hvilken form de kontinuerte variable skal<br />
inkluderes. Vurdér hvordan edema skal inkluderes (lav evt.<br />
et trendtest).<br />
3) Afhænger effekten af edema af køn<br />
4) Afhænger effekten af de kontinuerte variable af køn Kan<br />
man fores<strong>til</strong>le sig andre mulige interaktioner I så fald,<br />
udfør et passende test.<br />
41 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
5) Lav et overall test for effekten af bilirubin, prothrombin og<br />
albumin.<br />
6) Prøv at formulere (i ord), hvad modellen fortæller.<br />
Når du beskriver effekten af bilirubin, så giv et estimat for<br />
HR for en patient med bili=3.4 vs bili=0.8 (ens på de øvrige<br />
variable). Disse tal er fundet ved kommandoen<br />
quan<strong>til</strong>e(bili,c(.25,.75))<br />
Hvad beskriver denne HR<br />
Find også et KI. (Beregn det selv i hånden. Kan du ikke<br />
huske regnereglerne, se evt. vink <strong>til</strong> øvelserne fra sidste<br />
gang, TTP spg 4).<br />
Hvor meget større er risikoen for en patient, som er et årti<br />
ældre end en anden patient (men sammenlignelig på de<br />
øvrige variable) Bestem et KI.<br />
7) Kontroller PH-antagelsen for alle variablene.<br />
42 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
Akut Lymfoblastær Leukæmi:<br />
I 1992-1996 blev 538 nordiske børn med ALL randomiseret <strong>til</strong><br />
traditionel vedligeholdelsesbehandling (VB) eller<br />
pharmakologisk baseret VB. Vi har her nogle data <strong>til</strong> rådighed<br />
for 468 af børnene med oplysninger om<br />
st<br />
sl<br />
recidiv<br />
pige<br />
kontrol<br />
wbc<br />
tpmtsnit<br />
start på VB<br />
EOF i dage<br />
1=recidiv, 0 ellers<br />
1=pige, 0=dreng<br />
1=traditionel, 0=pharmakologi<br />
wbc ved diagnose<br />
gennemsnit TPMT-værdi (aktivitet af enzym)<br />
Data ligger på kursushjemmesiden i ALL.csv.<br />
1) Formuler en model og kontroller den (dvs check PH,<br />
linearitet og vekselvirkninger). Er der nogle<br />
sammenhænge i disse data, som man ikke umiddelbart<br />
ville forvente<br />
43 / 44
u n i v e r s i t y o f c o p e n h a g e n<br />
d e p a r t m e n t o f b i o s t a t i s t i c s<br />
2) Kør den model, du er nået frem <strong>til</strong>, stratificeret på<br />
risikogruppe.<br />
Test om effekten af tpmtsnit er den samme over de tre<br />
strata.<br />
3) Sammenlign resultaterne med Schmiegelow et al., JCO<br />
(2003), som kan hentes som pdf fra<br />
http://pubget.com/paper/12663723.<br />
Fit din model med den samme parameterisering af køn og<br />
randomiseringsgruppe. Hvorfor tror du, at man har valgt<br />
netop denne parameterisering<br />
44 / 44