19.01.2015 Views

Introduktion til overlevelsesanalyse - Cox regression III

Introduktion til overlevelsesanalyse - Cox regression III

Introduktion til overlevelsesanalyse - Cox regression III

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Faculty of Health Sciences<br />

<strong>Introduktion</strong> <strong>til</strong> <strong>overlevelsesanalyse</strong><br />

<strong>Cox</strong> <strong>regression</strong> <strong>III</strong><br />

Susanne Rosthøj<br />

Biostatistisk Afdeling<br />

Institut for Folkesundhedsvidenskab<br />

Københavns Universitet<br />

sr@biostat.ku.dk<br />

Kursushjemmeside:<br />

www.biostat.ku.dk/~sr/forskningsaar/survival2011


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Program for dag 4<br />

• Repetition to kategoriske variable:<br />

Den additive model<br />

Interaktion<br />

En kontinuert variabel<br />

• Interaktion mellem en kategorisk og en kontinuert variabel<br />

• Forsinket indgang<br />

• Proportional hazards antagelsen<br />

Stratificering<br />

Modelkontrol : Simple grafiske metoder<br />

• Gennemgående eksempel:<br />

• Leukæmi patienter i remission.<br />

Dagens gennemgang svarer <strong>til</strong> Kleinbaum & Klein rest kapitel<br />

3, kapitel 4 (I-V) og kapitel 5.<br />

2 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

To kategoriske variable<br />

Vi ønsker at beskrive effekten af behandling justeret for<br />

(kategoriseret) logWBC. <strong>Cox</strong> modellen bliver<br />

⎧<br />

1 placebo, logWBC i < 2.37<br />

exp(β 2 ) placebo, logWBC i ∈ [2.37; 3.23)<br />

⎪⎨ exp(β 3 ) placebo, logWBC i ≥ 3.23.<br />

λ i (t) = λ 0 (t)<br />

exp(β 1 ) behandling, logWBC i < 2.37<br />

exp(β 1 + β 2 ) behandling, logWBC i ∈ [2.37; 3.23)<br />

⎪⎩<br />

exp(β 1 + β 3 ) behandling, logWBC i ≥ 3.23.<br />

= λ 0 (t) exp(β 1 behandling i + β 2 {WBC-grp 2} i + β 3 {WBC-grp 3} i )<br />

Fortolkning af <strong>regression</strong>sparametrene:<br />

• exp(β 1 ) er HR for behandling vs placebo for fastholdt WBC.<br />

• exp(β 2 ) er HR for WBC-gruppe 2 vs WBC-gruppe 1 for fastholdt<br />

behandling. Tilsvarende for exp(β 3 ).<br />

3 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Den additive model<br />

Vi kan illustrere modellen i følgende tabel på<br />

log-hazard-skalaen:<br />

Kategoriseret logWBC<br />

Z = 1 Z = 2 Z = 3<br />

Placebo 0 β 2 β 3<br />

Behandling β 1 β 1 + β 2 β 1 + β 3<br />

Forskellen mellem placebo og behandling er den samme for<br />

hvert niveau af logWBC-gruppe.<br />

Forskellen mellem logWBC-grupperne er den samme for hver<br />

behandlingsgruppe.<br />

Denne model kaldes også den additive model.<br />

4 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Interaktion mellem kategoriske variable<br />

Den additive model<br />

Kategoriseret logWBC<br />

Z = 1 Z = 2 Z = 3<br />

Placebo 0 β 2 β 3<br />

Behandling β 1 β 1 + β 2 β 1 + β 3<br />

forudsætter, at der ikke er interaktion (vekselvirkning).<br />

Interaktionsmodellen <strong>til</strong>lader at effekten af behandling<br />

afhænger af logWBC:<br />

Kategoriseret logWBC<br />

Z = 1 Z = 2 Z = 3<br />

Placebo 0 β 2 β 3<br />

Behandling β 1 β 1 + β 2 + β 4 β 1 + β 3 + β 5<br />

dvs. en model hvor parametrene varierer fuldstændigt frit.<br />

5 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

En kontinuert forklarende variabel<br />

<strong>Cox</strong>-modellen med WBC som kontinuert forklarende variabel er<br />

λ i (t) = λ 0 (t) exp(βWBC i ).<br />

Sammenlignes to patienter med en forskel på 1 i WBC, når det<br />

laveste er referencen, fås<br />

HR = λ 0(t) exp(β(WBC + 1)<br />

λ 0 (t) exp(βWBC)<br />

= exp(β).<br />

Dvs fortolkningen er : for hver gang WBC øges med 1,<br />

skal HR ganges med exp(β).<br />

6 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Log-hazard for en kontinuert variabel<br />

<strong>Cox</strong>-modellen på log-hazard-skala lyder<br />

log(λ i (t)) = log(λ 0 (t)) + βWBC i<br />

dvs. effekten af WBC er lineær på log-hazard-funktionen:<br />

baseline<br />

log−hazard<br />

0 2 4 6 8 10<br />

0 50 100 150<br />

WBC<br />

7 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

logWBC som forklarende variabel<br />

Sidst nåede vi frem <strong>til</strong> <strong>Cox</strong> modellen som inkluderer WBC på<br />

log-skala. Vi fandt:<br />

> cox10 summary(cox10)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ logWBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

logWBC 1.646 5.189 0.298 5.525 3.29e-08 ***<br />

---<br />

Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />

exp(coef) exp(-coef) lower .95 upper .95<br />

logWBC 5.188 0.1927 2.893 9.304<br />

Concordance= 0.809 (se = 0.062 )<br />

Rsquare= 0.564 (max possible= 0.988 )<br />

Likelihood ratio test= 34.84 on 1 df, p=3.577e-09<br />

Wald test = 30.53 on 1 df, p=3.294e-08<br />

Score (logrank) test = 36.62 on 1 df, p=1.433e-09<br />

8 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Fortolkning af effekten af WBC på log-skala<br />

HR øges med en faktor 5.189 for hver gang logWBC øges med 1.<br />

Hvad betyder det<br />

det vil sige at<br />

1 = log(WBC 1 ) − log(WBC 2 )<br />

= log( WBC 1<br />

WBC 2<br />

)<br />

WBC 1<br />

WBC 2<br />

= exp(1) = 2.72.<br />

Dermed er fortolkningen, at HR øges med en faktor 5.189 for hver<br />

gang WBC øges med en faktor 2.72.<br />

Løsning: Brug logaritme med base 2 i stedet.<br />

9 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

<strong>Cox</strong>-modellen med log 2 (WBC)<br />

> log2WBC cox11 summary(cox11)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ log2WBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

log2WBC 1.1412 3.1306 0.2066 5.525 3.29e-08 ***<br />

---<br />

Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />

exp(coef) exp(-coef) lower .95 upper .95<br />

log2WBC 3.131 0.3194 2.088 4.693<br />

Concordance= 0.809 (se = 0.062 )<br />

Rsquare= 0.564 (max possible= 0.988 )<br />

Likelihood ratio test= 34.84 on 1 df, p=3.577e-09<br />

Wald test = 30.53 on 1 df, p=3.294e-08<br />

Score (logrank) test = 36.62 on 1 df, p=1.433e-09<br />

Ved en fordobling af WBC øges HR med en faktor 3.13 (95% KI<br />

2.09-4.69). Eller : risikoen for <strong>til</strong>bagefald mere end 3-dobles<br />

ved en fordobling af WBC.<br />

Bemærk at teststørrelserne og p-værdierne er uændrede.<br />

10 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

En binær og en kontinuert forklarende variabel<br />

Vi kan nu vurdere effekten af behandling justeret for log 2 WBC.<br />

Modellen lyder på log-hazard skalaen<br />

log(λ i (t)) = log(λ 0 (t)) + β 1 behandling i + β 2 log 2 (WBC i )<br />

dvs. effekten af log 2 WBC er lineær på log-hazard-funktionen, men vi<br />

<strong>til</strong>lader forskelligt niveau (intercept) afhængigt af behandlingsgruppe:<br />

baseline<br />

log−hazard<br />

0 2 4 6 8<br />

Placebo<br />

Behandling<br />

0 2 4 6 8<br />

log2WBC<br />

11 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

En binær og en kontinuert forklarende variabel i R<br />

> treatment cox12 summary(cox12)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

factor(treatment)1 -1.3861 0.2501 0.4248 -3.263 0.0011 **<br />

log2WBC 1.1720 3.2286 0.2328 5.034 4.8e-07 ***<br />

---<br />

Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1<br />

exp(coef) exp(-coef) lower .95 upper .95<br />

factor(treatment)1 0.2501 3.9991 0.1088 0.5749<br />

log2WBC 3.2286 0.3097 2.0456 5.0955<br />

Concordance= 0.852 (se = 0.062 )<br />

Rsquare= 0.671 (max possible= 0.988 )<br />

Likelihood ratio test= 46.71 on 2 df, p=7.187e-11<br />

Wald test = 33.6 on 2 df, p=5.061e-08<br />

Score (logrank) test = 46.07 on 2 df, p=9.921e-11<br />

12 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Interaktion mellem binær og kontinuert variabel<br />

Interaktionsmodellen lyder (med placebo som baseline)<br />

λ i (t) =<br />

{<br />

λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />

λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo<br />

svarende <strong>til</strong> at vi har to ikke-parallelle linier på<br />

log-hazard-skalaen:<br />

baseline<br />

log−hazard<br />

0 2 4 6 8<br />

Placebo<br />

Behandling<br />

0 2 4 6 8<br />

log2WBC<br />

13 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Fortolkning af interaktionen<br />

λ i (t) =<br />

{<br />

λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />

λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo<br />

I denne model er HR for<br />

• behandling vs placebo:<br />

exp(β 1+β 2log 2 WBC)<br />

exp(β 3log 2 WBC)<br />

• log 2 WBC+1 vs log 2 WBC:<br />

exp(β 1+β 2(log 2 WBC+1))<br />

exp(β 1+β 2log 2 WBC)<br />

exp(β 3(log 2 WBC+1))<br />

exp(β 3log 2 WBC)<br />

= exp(β 1 + (β 2 − β 3 )log 2 WBC)<br />

= exp(β 2 ) hvis behandlet<br />

= exp(β 3 ) hvis placebo.<br />

Dvs:<br />

Effekten af behandling afhænger af WBC. Effekten af WBC<br />

afhænger af behandlingsgruppe.<br />

14 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Interaktion mellem binær og kontinuert variabel<br />

I interaktionsmodellen<br />

λ i (t) =<br />

{<br />

λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />

λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo (1)<br />

lyder hypotesen om manglende interaktion<br />

H 0 : β 2 = β 3 .<br />

Vi kan omparameterisere modellen <strong>til</strong><br />

λ i (t) =<br />

{<br />

λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP<br />

λ 0 (t) exp( (β 2 + ˜β 3 ) log 2 WBC i ) hvis i får placebo (2)<br />

hvorved hypotesen lyder<br />

H 0 : ˜β 3 = 0.<br />

15 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Illustration af interaktion vs den additive model<br />

baseline<br />

log−hazard<br />

−2 0 2 4 6<br />

Placebo<br />

Behandling<br />

Placebo H_0<br />

Behandling H_0<br />

0 1 2 3 4 5<br />

logWBC<br />

På log-hazard-skalaen svarer manglende interaktion (H 0 ) <strong>til</strong><br />

parallelle linier.<br />

16 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Interaktionsmodellen i R<br />

Model (1):<br />

> cox13 summary(cox13)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ factor(treatment) + factor(treatment):log2WBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

factor(treatment)1 -2.37491 0.09302 1.70547 -1.393 0.164<br />

factor(treatment)0:log2WBC 1.07777 2.93812 0.27633 3.900 9.61e-05 ***<br />

factor(treatment)1:log2WBC 1.29786 3.66145 0.31289 4.148 3.35e-05 ***<br />

---<br />

Model (2):<br />

> cox14 summary(cox14)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC +<br />

factor(treatment) * log2WBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

factor(treatment)1 -2.37491 0.09302 1.70547 -1.393 0.164<br />

log2WBC 1.07777 2.93812 0.27633 3.900 9.61e-05 ***<br />

factor(treatment)1:log2WBC 0.22009 1.24619 0.36445 0.604 0.546<br />

---<br />

17 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Flere variable<br />

Vi kan vurdere effekten af behandling justeret for køn og<br />

logWBC:<br />

> cox15 summary(cox15)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ factor(treatment) + log2WBC +<br />

factor(female))<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

factor(treatment)1 -1.5036 0.2223 0.4615 -3.258 0.00112 **<br />

log2WBC 1.1658 3.2086 0.2333 4.997 5.82e-07 ***<br />

factor(female)1 0.3147 1.3698 0.4545 0.692 0.48872<br />

---<br />

Hvad er baselinegruppen i denne model<br />

Hvilken model skal vi vælge som den endelige model<br />

18 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Forsinket indgang<br />

Kun de individer, for hvilken en hændelse er indtruffet, bliver<br />

observeret.<br />

Eksempel: Vedligeholdelsesbehandling af børn med leukæmi.<br />

0 Start VB<br />

◦ • ✲<br />

Tid 0 er diagnosedatoen, men patienterne starter ikke<br />

vedligeholdelsesbehandlingen samtidigt.<br />

19 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Illustration af forsinket indgang<br />

Vedligeholdelsesbehandling af ALL<br />

Patient<br />

1 2 3 4 5 6 7 8 9 10<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

365 730 1095<br />

År siden diagnose<br />

20 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Håndtering af forsinket indgang<br />

For hvert dødstidspunkt t i holdes øje med risikomængden R(t i )<br />

(mængden af patienter under risiko for død umiddelbart før t i ).<br />

Udtrykket for den partielle likelihood for <strong>Cox</strong>-modellen er<br />

uændret<br />

L(β) =<br />

k∏<br />

i=1<br />

exp(βX i )<br />

∑j∈R(t i ) exp(βX j) ,<br />

men forskellen er, at patienterne <strong>til</strong>lades at træde ind og ikke<br />

kun ud af studiet på forskellige tidspunkter.<br />

Tilsvarende for Kaplan-Meier-estimatoren.<br />

Forsinket indgang er let at styre i R, idet vi definerer vores<br />

respons ved: Surv(indgang,udgang,event).<br />

21 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

<strong>Cox</strong> modellens antagelser<br />

Den generelle <strong>Cox</strong> model er<br />

λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + · · · + β p X ip )<br />

når vi inkluderer p forklarende variable i modellen.<br />

Antagelserne er<br />

1) effekten af de forklarende variable er additiv og lineær på<br />

log-hazard-skalaen<br />

2) kun baseline hazard afhænger af tiden t, dvs. at den<br />

relative risiko imellem to individer er konstant over tid<br />

(proportional hazards).<br />

Vi er nødt <strong>til</strong> at kontrollere om disse antagelser er rimelige.<br />

Sidst så vi på 1) og vi vil nu gå videre med 2).<br />

22 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Proportionale hazards med én forklarende variabel<br />

For <strong>Cox</strong>-modellen indeholdende én forklarende variabel<br />

λ i (t) = λ 0 (t) exp(βI(patient i behandlet))<br />

er proportionalitetsantagelsen at hazard ratio for i behandlet vs<br />

j placebo<br />

λ i (t)<br />

λ j (t)<br />

= exp(β)<br />

ikke afhænger af tiden t dvs. at<br />

λ i (t)<br />

λ j (t)<br />

med mindre f er en konstant.<br />

≠<br />

f (t)<br />

23 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

PH med flere forklarende variable<br />

For den generelle <strong>Cox</strong>-model indeholdende flere forklarende<br />

variable<br />

λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + . . . + β p X ip )<br />

er proportionalitetsantagelsen at hazard ratio mellem individ i<br />

og j er konstant<br />

λ i (t)<br />

λ j (t)<br />

= exp(β 1 (X i1 − X j1 ) + . . . + β p (X ip − X jp )),<br />

dvs. ikke afhænger af tiden t.<br />

Bemærk at dette svarer <strong>til</strong> at vi skal have PH mellem grupper<br />

for de kategoriske variable.<br />

24 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Et eksempel på en stratificeret model<br />

Vedligeholdelsesbehandling af børn med ALL, stratificeret på<br />

risikogruppe.<br />

Intermediær risiko<br />

Standard risiko<br />

hazard rate<br />

−2 −1 0 1 2 3 4 5 6<br />

År siden ophør af vedligeholdelsesbehandling<br />

25 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Hvorfor bekymre sig om PH-antagelsen<br />

Det er vigtigt at undersøge proportionalitetsantagelsen:<br />

• Hvis PH ikke er opfyldt vil estimatet fra <strong>Cox</strong> <strong>regression</strong>en<br />

være en gennemsnitlig effekt over tid.<br />

• Hvis vi ikke tager højde for en eventuel tidsafhængig effekt<br />

kan der opstå bias for nogle af de øvrige estimerede<br />

effekter i modellen.<br />

• Det kan være vigtigt at forstå, hvordan effekten varierer<br />

over tid, idet det kan gøre os klogere på de mekanismer,<br />

som genererer data.<br />

• I nogle sammenhænge kan den gennemsnitlige effekt dog<br />

være en interessant / acceptabel beskrivelse af effekten -<br />

men det er vigtigt at kende <strong>til</strong> konkvenserne af at ignorere<br />

en tidsafhængig effekt.<br />

26 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Manglende PH med en forklarende variabel<br />

Når <strong>Cox</strong>-modellen indeholdende én forklarende variabel<br />

λ i (t) =<br />

{<br />

λ0 (t) hvis i får placebo<br />

λ 0 (t) exp(β) hvis i får behandling<br />

ikke er rimelig er en mulighed at lade hazarden variere<br />

fuldstændigt frit i hver kategori<br />

λ i (t) =<br />

{<br />

λ01 (t) hvis i får placebo<br />

λ 02 (t) hvis i får behandling<br />

Vi har nu ingen model og må estimere hazarden (snarere<br />

overlevelseskurverne) vha Kaplan-Meier metoden.<br />

Kategorierne kaldes nu for strata (ental: stratum).<br />

27 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Manglende PH med to forklarende variable<br />

<strong>Cox</strong>-modellen med behandling og log 2 WBC lyder<br />

λ i (t) = λ 0 (t) exp(β 1 I(patient i behandlet) + β 2 log 2 WBC i ).<br />

Antag at PH kun er opfyldt for log 2 WBC, dvs at<br />

λ i (t)<br />

λ j (t)<br />

= exp(β 2 (log 2 WBC i − log 2 WBC j ))<br />

for fastholdt behandlingsgruppe mens<br />

λ i (t)<br />

λ j (t)<br />

= f (t) ≠ exp(β 1 ).<br />

for fastholdt WBC.<br />

En mulig løsning er at stratificere på behandlingsgruppe:<br />

28 / 44<br />

λ i (t) =<br />

{<br />

λ01 (t) exp(β log 2 (WBC)) hvis i får placebo<br />

λ 02 (t) exp(β log 2 (WBC)) hvis i får behandling


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Stratificering<br />

Den generelle stratificerede model lyder<br />

λ i (t) = λ 0k (t) exp(β 1 X i1 + · · · β p X ip )<br />

hvor hvert strata k = 1, . . . , K har sin egen baseline hazard.<br />

Bemærk at der ikke er interaktion mellem strata-variablen og de<br />

øvrige variable (bør undersøges).<br />

Fordele og ulemper ved stratificering:<br />

29 / 44<br />

• Nyttigt når vi er nødt <strong>til</strong> at inkludere ’nuisance’ variable i<br />

modellen og er ligeglade med at beskrive effekten af<br />

variablene.<br />

• Ikke hensigtsmæssigt hvis variablen er af primær interesse<br />

(eg. behandling).<br />

• Vi kan ikke teste om strata-variablen har en effekt på<br />

overlevelsen.


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Den stratificerede <strong>Cox</strong>-model i R<br />

I R angives en strata-variabel vha strata:<br />

> cox14 summary(cox14)<br />

Call:<br />

coxph(formula = Surv(time, event) ~ strata(treatment) + log2WBC)<br />

n= 42, number of events= 30<br />

coef exp(coef) se(coef) z Pr(>|z|)<br />

log2WBC 1.0514 2.8616 0.2226 4.723 2.32e-06 ***<br />

---<br />

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1<br />

exp(coef) exp(-coef) lower .95 upper .95<br />

log2WBC 2.862 0.3495 1.85 4.427<br />

Concordance= 0.814 (se = 0.098 )<br />

Rsquare= 0.467 (max possible= 0.962 )<br />

Likelihood ratio test= 26.45 on 1 df, p=2.71e-07<br />

Wald test = 22.31 on 1 df, p=2.32e-06<br />

Score (logrank) test = 26.15 on 1 df, p=3.152e-07<br />

30 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Simpel grafisk modelkontrol<br />

Observeret (KM) vs forventet (<strong>Cox</strong>) overlevelse:<br />

Behandling<br />

Grupperet WBC<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 5 10 15 20 25 30 35<br />

0 5 10 15 20 25 30 35<br />

Køn<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

OBS!<br />

0 5 10 15 20 25 30 35<br />

Jævnfør øvelserne dag 2.<br />

31 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Grafisk modelkontrol via log(-log(overlevelse))<br />

For <strong>Cox</strong>-modellen er overlevelseskurven givet den forklarende<br />

variabel X i = I(patient i behandlet)<br />

{<br />

S(t | X i ) = S 0 (t) exp(βX i) S0 (t)<br />

=<br />

exp(β) hvis i får behandling<br />

S 0 (t) hvis i får placebo.<br />

Det betyder at<br />

log(− log(S(t | X i ))) = log(− log(S 0 (t))) + βX i<br />

svarende <strong>til</strong> at differensen<br />

log(− log(S(t | X i ))) − log(− log(S(t | X j ))) = β(X i − X j )<br />

mellem to individer i og j ikke afhænger af tiden t, dvs at<br />

overlevelseskurverne er parallelle som funktion af t.<br />

log(-log(·))-funktionen kaldes også for cloglog-funktionen.<br />

32 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

cloglog-kurver for kategoriske variable<br />

Med kategoriske forklarende variable kan vi estimere<br />

overlevelseskurven for hvert niveau af variablen ved<br />

Kaplan-Meier-kurven og plotte log(-log(S))-kurverne i ét plot:<br />

Behandling<br />

logWBC<br />

−2.0 −1.0 0.0 1.0<br />

Placebo<br />

Behandling<br />

−2.5 −1.5 −0.5 0.5<br />

Lav<br />

Mellem<br />

Høj<br />

1 2 5 10 20<br />

1 2 5 10 20<br />

Køn<br />

−3.0 −2.0 −1.0 0.0<br />

Mand<br />

Kvinde<br />

OBS!<br />

Bemærk log-skala<br />

på x-aksen (default i R).<br />

1 2 5 10 20<br />

33 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Simultan evaluering af PH-antagelsen<br />

Vi bør evaluere PH-antagelsen simultant (samtidigt) når vi har<br />

flere forklarende variable.<br />

Kategoriser de kontinuerte og se på cloglog-kurverne for alle<br />

kombinationer af de forklarende variable:<br />

−2.0 −1.0 0.0<br />

1 2 5 10 20<br />

Uoverskueligt med flere variable.<br />

Nogle strata har meget få events, hvorfor det bliver svært at<br />

sammenligne kurverne.<br />

34 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Simultan evaluering af PH vha <strong>Cox</strong>-modellen<br />

Vi kan kontrollere PH-antagelsen for én variabel i en <strong>Cox</strong><br />

model, hvor vi har justeret for de øvrige variable:<br />

1) Stratificér <strong>Cox</strong>-modellen på variablen, for hvilken PH skal<br />

kontrolleres.<br />

2) Estimér de justerede overlevelseskurver for hvert stratum.<br />

Disse afhænger af de øvrige kovariatværdier → vælg<br />

eventuelt gennemsnitlige / median værdier.<br />

3) Plot cloglog-kurver for hvert stratum som funktion af t (evt<br />

log(t)) og vurdér om linierne er parallelle.<br />

Udfør 1)-3) for alle variablene. Derved kan vi vurdere, om der<br />

skal stratificeres på en eller flere variable.<br />

35 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Justerede cloglog-kurver i R<br />

Vi vil vurdere PH for køn i remissionsdata. Den stratificerede<br />

model inkluderende alle variable lyder:<br />

λ i (t) =<br />

{<br />

λ01 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er mand<br />

λ 02 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er kvinde.<br />

hvor beh i =1 hvis i er behandlet, 0 ellers.<br />

I R fittes modellen, overlevelseskurverne bestemmes og<br />

cloglog-kurverne plottes med:<br />

cox15


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Proportionalitetsantagelsen for køn er stadig ikke opfyldt:<br />

−3 −2 −1 0 1<br />

1 2 5 10 20<br />

37 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Mulige løsninger på manglende PH<br />

Der kan tages højde for afvigelse fra PH-antagelsen på<br />

følgende måder:<br />

1) Stratificering.<br />

2) Benyt en anden model (e.g. Accelerated Failure Time,<br />

additiv hazard model).<br />

3) Inddeling af tidsaksen. Måske holder PH-antagelsen over<br />

mindre tidsintervaller. Lav separate analyser.<br />

38 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

4) Vi kan acceptere <strong>Cox</strong>-modellen med en tidsafhængig effekt<br />

λ i (t) = λ 0 (t) exp(β(t)X i )<br />

og forsøge at beskrive denne effekt ved at <strong>til</strong>føje en<br />

tidsafhængig version af X. F.eks. kan vi formulere en<br />

tidsafhængig effekt ved<br />

β 1 X 1 + β 2 X 2 (t) =<br />

{<br />

β1 X 1 t < 1 år<br />

(β 1 + β 2 )X 1 t ≥ 1 år<br />

hvor X 2 (t) = X 1 I(t ≥ 1 år) er den tidsafhængige variabel.<br />

39 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

4) Fortsat:<br />

Måske øges / reduceres effekten lineært med tiden<br />

svarende <strong>til</strong> modellen<br />

λ i (t) = λ 0 (t) exp(β(t)X i ) = λ 0 (t) exp((β 1 + β 2 t)X i )<br />

som kan beskrives vha. den tidsafhængige variabel<br />

X 2 (t) = t × X<br />

β 1 X + β 2 X 2 (t) = β 1 X + β 2 tX = (β 1 + β 2 t)X.<br />

For at kunne formulere en sådan model er vi nødt <strong>til</strong> at<br />

undersøge hvordan den tidsafhængige effekt ser ud. (Vi<br />

undersøger dette næste gang vha. residualer).<br />

Håndteringen af tidsafhængige variable i R kræver lidt<br />

programmering (men er principielt simpelt nok).<br />

Se KK kapitel 6.<br />

40 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Øvelser<br />

PBC-data (Primary Biliary Cirrhosis).<br />

Vi vil her forsøge at beskrive risikoen for død (status=2) vha<br />

følgende forklarende variable:<br />

Alder, køn, edema, bilirubin, prothrombin time, albumin.<br />

1) Aktivér datasættet pbc i survival-pakken. Find eventuelt<br />

beskrivelser af dette datasæt ved at søge på nettet.<br />

2) Formulér en passende model:<br />

Overvej i hvilken form de kontinuerte variable skal<br />

inkluderes. Vurdér hvordan edema skal inkluderes (lav evt.<br />

et trendtest).<br />

3) Afhænger effekten af edema af køn<br />

4) Afhænger effekten af de kontinuerte variable af køn Kan<br />

man fores<strong>til</strong>le sig andre mulige interaktioner I så fald,<br />

udfør et passende test.<br />

41 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

5) Lav et overall test for effekten af bilirubin, prothrombin og<br />

albumin.<br />

6) Prøv at formulere (i ord), hvad modellen fortæller.<br />

Når du beskriver effekten af bilirubin, så giv et estimat for<br />

HR for en patient med bili=3.4 vs bili=0.8 (ens på de øvrige<br />

variable). Disse tal er fundet ved kommandoen<br />

quan<strong>til</strong>e(bili,c(.25,.75))<br />

Hvad beskriver denne HR<br />

Find også et KI. (Beregn det selv i hånden. Kan du ikke<br />

huske regnereglerne, se evt. vink <strong>til</strong> øvelserne fra sidste<br />

gang, TTP spg 4).<br />

Hvor meget større er risikoen for en patient, som er et årti<br />

ældre end en anden patient (men sammenlignelig på de<br />

øvrige variable) Bestem et KI.<br />

7) Kontroller PH-antagelsen for alle variablene.<br />

42 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

Akut Lymfoblastær Leukæmi:<br />

I 1992-1996 blev 538 nordiske børn med ALL randomiseret <strong>til</strong><br />

traditionel vedligeholdelsesbehandling (VB) eller<br />

pharmakologisk baseret VB. Vi har her nogle data <strong>til</strong> rådighed<br />

for 468 af børnene med oplysninger om<br />

st<br />

sl<br />

recidiv<br />

pige<br />

kontrol<br />

wbc<br />

tpmtsnit<br />

start på VB<br />

EOF i dage<br />

1=recidiv, 0 ellers<br />

1=pige, 0=dreng<br />

1=traditionel, 0=pharmakologi<br />

wbc ved diagnose<br />

gennemsnit TPMT-værdi (aktivitet af enzym)<br />

Data ligger på kursushjemmesiden i ALL.csv.<br />

1) Formuler en model og kontroller den (dvs check PH,<br />

linearitet og vekselvirkninger). Er der nogle<br />

sammenhænge i disse data, som man ikke umiddelbart<br />

ville forvente<br />

43 / 44


u n i v e r s i t y o f c o p e n h a g e n<br />

d e p a r t m e n t o f b i o s t a t i s t i c s<br />

2) Kør den model, du er nået frem <strong>til</strong>, stratificeret på<br />

risikogruppe.<br />

Test om effekten af tpmtsnit er den samme over de tre<br />

strata.<br />

3) Sammenlign resultaterne med Schmiegelow et al., JCO<br />

(2003), som kan hentes som pdf fra<br />

http://pubget.com/paper/12663723.<br />

Fit din model med den samme parameterisering af køn og<br />

randomiseringsgruppe. Hvorfor tror du, at man har valgt<br />

netop denne parameterisering<br />

44 / 44

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!