Overlevelsesanalyse

Ventetidsanalyse 

(“Overlevelsesanalyse”) 

Birthe Lykke Thomsen 

Det Nationale Forskningscenter for Arbejdsmiljø 

Ventetidsanalyse Baggrund 3 

Data: 

Randomiseret studie af patienter, der har blødt én 

gang. Respons er, hvorn˚ar patienten rebløder. 

(EVASP, 1984) 


˚Areknuder i spiserøret er en alvorlig følgesygdom, der kan optræde 

hos patienter med levercirrose. Hvis en af ˚areknuderne brister, er 

patienten i alvorlig risiko for at dø af den indvendige blødning. 

Forskningsspørgsm˚al: Vi ønsker at undersøge, om 

skleroterapi kan bruges til at udskyde forekomsten af 

reblødning hos patienter med blødende ˚areknuder i 

spiserøret p.g.a. levercirrose. 


Særlige egenskaber ved denne slags data 

• Respons: tid til en given hændelse – her reblødning; men det 

kunne ogs˚a være død, sygdom, helbredelse, tilbagefald, 

graviditet, . . . 

– gør det særligt interessant at lave simple modeller for 

sandsynligheden for, at noget sker p˚a et givet tidspunkt 

forudsat, at personen p˚a det tidspunkt er under risiko for, at 

det sker 

– disse betingede sandsynligheder kaldes rater eller hazards 

– typisk kigger man efter multiplikative effekter p˚a raten – det 

kaldes Cox’s proportional hazards model 

– hvis (og kun hvis) raten er konstant, kan den estimeres ved 

antal hændelser/samlet risikotid 

(standard formel fra epidemiologi) og effekter estimeres ved 

Poisson regression (ikke med p˚a basal statistik kurset)


Særlige egenskaber ved denne slags data fortsat 

• Forsinket indgang og censurering: Vi har kun en større eller 

mindre bid af hvert individs liv med i vores studie 

– forsinket indgang: nogle personer er ikke med fra start 

– censurering: for nogle af individerne ved vi kun, at det 

endnu ikke var sket, da de gik ud af studiet 

• og vi m˚a kun bruge den tid, hvor vi ville tælle 

hændelsen med, n˚ar/hvis den skete 


Særlige metoder kan h˚andtere denne slags data 

Fordi raten er i fokus, ser man p˚a hvert tidspunkt, et ad gangen, og 

opsummerer derefter i en 

• Kaplan-Meier kurve 

• kumuleret (summeret) rate 

• Cox regression 


Særlige egenskaber ved denne slags data fortsat 

• Oftest ingen anelse om fordelingen af tid til hændelsen 

– den er i praksis stort set aldrig normalt fordelt 

(for censurerede, normalt fordelte data, f.eks. outcomes med 

detektionsgrænse, bruges PROC LIFEREG; se s. 61–79 i disse noter til 

selvstudium) 

– det kan nogle gange være rimeligt at tro, at raten er konstant 

– en forudsætning for mange epidemiologiske vurderinger 

• men det er altid en forudsætning, at censurering er uafhængig af 

outcome givet de kendte, forklarende variable – censurering m˚a 

ikke være prædiktivt for, om hændelsen ellers snart ville 

ske 

Ventetidsanalyse Kaplan-Meier 8 

Reblødning i de to grupper: Kaplan-Meier og kumuleret rate 

uden henholdsvis med punktvise konfidensgrænser


Fortolkning af Kaplan-Meier og kumuleret rate 

Hvis hændelsen er “død af hvilken som helst ˚arsag”, s˚a viser 

Kaplan-Meier kurven overlevelsessandsynligheden som funktion af 

tiden t, dvs. hvor stor en andel, man kan regne med vil overleve 

mindst til tid t. 

Hvis hændelsen er hvad som helst andet, og død har medført 

censurering, s˚a giver Kaplan-Meier kurven ingen fornuftig mening! 

Den kumulerede rate har ingen direkte, intuitiv fortolkning. Den er 

ikke lig sandsynligheden for, at hændelsen sker inden det givne 

tidspunkt – men det er en tilnærmelse, n˚ar den kumulerede rate er 

lille. Hældningen p˚a den kumulerede rate er lig med selve raten. 

Rater og kumulerede rater er korrekte, ogs˚a n˚ar død medfører 

censurering! 


Beregning af Kaplan-Meier og kumuleret rate 

(alt under bølgelinien er skjult for os, og kun de grønne personer er med fra start) 


Reblødning i de to grupper – standard plots 

Trappekurve: et trin ned hver gang, 

der sker en hændelse. 

S(T ) ≈ exp(−R(T )) 

R(T ) ≈ − ln(S(T )) 

(Stykkevis) konstant rate giver 

(stykkevis) lineær kumuleret rate R(t). 

For tidsintervaller med lineær R(t) kan 

selve raten estimeres som forskellen 

mellem startværdi og slutværdi for 

R(t) divideret med længden af 

tidsintervallet. 

Høj rate=stejl hældning, 

lav rate=flad kurve. 


Beregning af Kaplan-Meier og kumuleret rate 

P˚a en given dag t observerer vi for hver gruppe g (kaldes 

sædvanligvis “stratum”, flertal “strata”, i ventetidsanalyse) 

1. ng(t) individer totalt 

2. mg(t) individer, der begynder at rebløde 

hvilket giver den daglige reblødningsrate 

rg(t) = mg(t) 

ng(t) 

Kaplan-Meier estimatet Sg(T ) p˚a dag T for gruppe g beregnes ved 

at gange leddene 1 − rg(t) sammen for alle dage t op til og med dag T . 

Nelson-Aalen estimatet for den kumulerede reblødningsrate Rg(T ) 

p˚a dag T for gruppe g beregnes ved at lægge de daglige 

reblødningsrater sammen for alle dage t op til og med dag T .


Estimation af Kaplan-Meier kurver v.h.a. PHREG 

Respons: 

“Det tidspunkt, hændelsen sker”; men det sker 

ikke for alle, s˚a det er nødvendigt at bruge en 

kombination af 2 responsvariable: 

“tid” og “hvad skete der”. 

Datasættet SKL indeholder (bl.a.) 

DAY: tid for udgang 

BLD: 

1 for reblødning, 

0 for censurering 

SKLERO: 

1 for skleroterapigruppen, 

0 for den medicinsk behandlede gruppe 

PROC PHREG DATA=skl NOPRINT; 

MODEL Day*Bld(0) = ; 

STRATA Sklero; 

BASELINE 

OUT=km 

SURVIVAL=KMcurves 

LOWER=LowerBound 

UPPER=UpperBound 

/ METHOD=PL CLTYPE=LOGLOG; 

RUN; 

SYMBOL1 C=BLACK V=NONE I=STEPLJ; 

SYMBOL2 C=RED V=NONE I=STEPLJ; 

PROC GPLOT DATA=km; 

PLOT kmcurves*day=sklero; 

RUN; 

Ventetidsanalyse Log rank 15 

Log rank test (svarende til en-sidet variansanalyse) 

Grupper kan sammenlignes v.h.a. et log rank test. 

Princip (for 2 grupper): 

Vi forudsætter (“nul-hypotesen”), at der ingen forskel er p˚a de 2 

grupper, og betinger for hvert ’døds’tidspunkt med 

• det observerede totale antal ’døde’ m(ti) (= m1(ti) + m2(ti)) 

• antallet af personer under risiko p˚a det givne tidspunkt i hver af 

de 2 grupper, n1(ti) og n2(ti) (n1(ti) + n2(ti) = n(ti)) 

For gruppe 1 kan vi s˚a for hvert ’døds’tidspunkt ti beregne 

• det forventede antal ’døde’ E1(ti) = m(ti) · n1(ti) 

n(ti) 

• variansen p˚a antallet af ’døde’ 

V (ti) = n1(ti) 

n(ti) 

· n2(ti) 

n(ti) 

· m(ti)·(n(ti)−m(ti)) 

(n(ti)−1) 


Ekstra SAS kode for at f˚a konfidensgrænser med fra PHREG 

SAS kode for nødvendige 

datamodifikationer: 

DATA km; SET km; 

IF sklero=0 THEN DO; 

type=1; curve=kmcurves; OUTPUT; 

type=2; curve=lowerbound; OUTPUT; 

type=3; curve=upperbound; OUTPUT; 

END; 

IF sklero=1 THEN DO; 

type=4; curve=kmcurves; OUTPUT; 

type=5; curve=lowerbound; OUTPUT; 

type=6; curve=upperbound; OUTPUT; 

END; 

RUN; 

Eksempel p˚a kald af GPLOT: 

PROC GPLOT DATA=km; 

PLOT curve*day=type 

/ HAXIS=AXIS1 VAXIS=AXIS2 NOLEGEND; 

SYMBOL1 R=1 C=BLACK V=NONE I=STEPLJ L=1 W=5; 

SYMBOL2 R=2 C=BLACK V=NONE I=STEPLJ L=33; 

SYMBOL3 R=1 C=RED V=NONE I=STEPLJ L=1 W=5; 

SYMBOL4 R=2 C=RED V=NONE I=STEPLJ L=35; 

AXIS1 LABEL = (’Dage fra randomisering’); 

AXIS2 LABEL = (A=90 R=0 ’S(t) = Kaplan-Meier’); 

RUN; 

(Alternativ SAS procedure. 

PROC LIFETEST DATA=skl PLOTS=(S) CONFTYPE=loglog; TIME day*bld(0); STRATA sklero; RUN; 

NB: Den duer ikke ved forsinket indgang!) 


Log rank test fortsat 

De forventede antal ’døde’ E1(ti), henholdsvis varianserne V (ti), adderes 

for alle ’døds’tidspunkter ti til E1, henholdsvis V . Desuden tælles det 

totale antal observerede ’døde’ M1 i gruppe 1. 

Log rank teststørelsen 

Log Rank Chi Square = (M1 − E1) 2 

, 

V 

er χ 2 -fordelt med 1 frihedsgrad. 

Tilnærmelse, der ogs˚a kan bruges for mere end 2 grupper, her G grupper: 

G∑ (Mg − Eg) 

Log Rank Chi Square ≈ 

2 

, 

er χ 2 -fordelt med G − 1 frihedsgrader (bemærk, at alle grupper bidrager 

til summen). 

g=1 

Eg

Ventetidsanalyse Styrkeberegning 17 

Styrkeberegning for ventetidsdata 

Summen af varianserne, V , brugt ved beregningen af log rank 

teststørrelsen, bruges ogs˚a ved styrkeberegninger: 

Hvis man ønsker at kunne p˚avise en rate ratio p˚a RR for aktiv versus 

kontrol med et tosidet signifikansniveau p˚a α og en styrke p˚a 1−β, s˚a skal 

man inkludere tilstrækkeligt mange personer til, at V ≥ 

( Uα/2 +U β 

ln(RR) 

(Ux=(1−x)-fraktilen i en normal fordeling, eksempelvis U 2.5%=1.96, 

U 5%=1.645, U 10%=1.282, U 20%=0.842) 

Hvis randomiseringsratioen (aktiv:kontrol) er a:1, og hændelsen er sjælden, 

er V ≈ a 

(a+1) 2 · M, hvor M=total antal hændelser, dvs. der skal inkluderes 

tilstrækkeligt mange personer til, at 

M ≥ 

(a + 1)2 

a 

· 

( ) 2 

Uα/2 + Uβ 

ln(RR) 


Dele af output fra PROC PHREG 

The PHREG Procedure 

Model Information 

Data Set WORK.SKL 

Dependent Variable Day 

Censoring Variable Bld 

Censoring Value(s) 0 

Ties Handling DISCRETE 

Summary of the Number of Event and Censored Values 

Percent 

Total Event Censored Censored 

187 91 96 51.34 

Model Fit Statistics 

Without With 

Criterion Covariates Covariates 

-2 LOG L 738.406 737.488 

: : : 

Testing Global Null Hypothesis: BETA=0 

Test Chi-Square DF Pr > ChiSq 

Likelihood Ratio 0.9175 1 0.3381 

Score 0.9174 1 0.3382 

Wald 0.9124 1 0.3395 

) 2 

. 


Log rank test ved hjælp af PROC PHREG 

Log rank teststørrelsen kan beregnes som score-teststørrelsen i 

PROC PHREG med brug af option TIES=DISCRETE: 

PROC PHREG DATA=skl; 

MODEL day*bld(0) = sklero / TIES=DISCRETE; 

RUN; 

Hvis der er mere end 2 grupper, er det nødvendigt at bruge et CLASS statement, 

eksempelvis 


CLASS sklero; 

MODEL day*bld(0) = sklero / TIES=DISCRETE; 

RUN; 


Log rank teststørrelse=0.9174, p=0.3382, findes ud for “Score” 

under “Testing Global Null Hypothesis: BETA=0” 

Output fra PROC PHREG fortsat 

Analysis of Maximum Likelihood Estimates 

Parameter Standard Hazard 

Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio 

Sklero 1 -0.20261 0.21212 0.9124 0.3395 0.817 

Log rank testet er d˚arligt til at detektere forskelle, der 

ændres markant med tiden, som en d˚arligere 

korttidsprognose samtidigt med en bedre langtidsprognose!

Ventetidsanalyse Opsummering 1. del 21 

Ventetidsdata karakteristika: 

Opsummering 1. del 

• “et tidspunkt ad gangen”: vi laver modeller for raten 

• censurering og forsinket indgang 

• ingen fordelingsantagelser 

Typisk grafik: 

• Kaplan-Meier (pas p˚a!) 

• kumuleret rate – tjek for stykkevis linearitet 

Sammenligning af grupper (det, der svarer til ensidet 

variansanalyse): 

• log rank test – d˚arligt til at detektere tidsvarierende effekter 

Ventetidsanalyse Cox model 23 

Cox’s regression model 

Denne model kaldes Cox’s regression model: 

r(t; X1, X2, . . . , Xk) = r0(t) · exp(b1X1 + b2X2 + . . . + bkXk) 

Summen i eksponenten, b1X1 + b2X2 + . . . + bkXk, kaldes ofte det 

“prognostiske indeks”. 

Hvis vi logaritmetransformerer og skriver b0(t) for ln(r0(t)), f˚as 

noget, der ligner de sædvanlige regressionsmodeller: 

ln(r(t; X1, X2, . . . , Xk)) = b0(t) + b1X1 + b2X2 + . . . + bkXk 

Bemærk, at logaritmen til den underliggende rate r0(t) svarer til den 

sædvanlige intercept parameter (der alts˚a afhænger af tiden her)! 


Proportionale rater 

Kvantificering af behandlingseffekten: 

r(t; sklero) = r(t; medicinsk) · B 

Effekt af ascites (væske i bughulen): 

r(t; ascites) = r(t; ingen ascites) · A 

Kombineret: 

r(t; sklero, ascites) = r(t; medicinsk, ascites) · B 

= r(t; medicinsk, ingen ascites) · A · B 

= r(t; medicinsk, ingen ascites) · exp(a + b) 

med a=ln(A) og b=ln(B). 

0 ∼ ingen ascites 

Sættes X1 = { 

1 ∼ ascites 

s˚a er 

0 ∼ og X2 = { medicinsk 

1 ∼ skleroterapi 

r(t; sklero, ascites) = r0(t) · exp(aX1 + bX2) 


En positiv værdi for en regressionsparameter bj betyder, at høje 

værdier af den tilsvarende kovariat Xj hører sammen med høj rate: 

For uønskede hændelser betyder det, at høje værdier forværrer 

prognosen, s˚a vær meget forsigtig med at bruge ordene 

“positiv/negativ” om effekter, brug eksempelvis “gavnlig/skadelig”.



MODEL day*bld(0) = ascites bilirub sklero / RISKLIMITS; 

RUN; 

--------------------------------------------------------- 

Summary of the Number of Event and Censored Values 

Percent 


177 87 90 50.85 

Parameter Standard 

Variable DF Estimate Error Chi-Square Pr>ChiSq 

Ascites 1 0.18072 0.22721 0.6326 0.4264 

Bilirub 1 0.00476 0.00112 18.1500 ChiSq 

Asc_Bili 21.2800 2

Ventetidsanalyse Specielle aspekter ved Cox modellen 29 

Forklarende variable i ventetidsanalyser: Regressionsvariable 

Regressionsvariable indg˚ar udelukkende via eksponenten, exp(bX), og 

ikke i den underliggende rate r0(t). Med andre ord, raterne antages 

at være proportionale for forskellige værdier af variablen, X: 

r(t; X = 1) = r0(t) · exp(b) og 

r(t; X = 2) = r0(t) · exp(2b) = r(t; X = 1) · exp(b) 

Konsekvens: 

1. effekten kan beskrive med et eneste tal (exp(b)), 

2. men dette tal er kun meningsfuldt, hvis antagelsen om 

proportionale rater holder (tilnærmelsesvis). 


Statifikation versus Interaktion 

Stratifikation er ikke det samme som interaktion! Effekten af 

stratifikationsvariablen ændres med tiden, men effekten afhænger ikke 

af de øvrige variable, og deres effekter antages at være identiske i de 

forskellige strata — i modsætning til den epidemiologiske brug af 

udtrykket “stratificerede analyser”, som betyder helt separate 

analyser for hver værdi af stratifikationsvariablen!! 

Interaktion betyder, at effekten af en variabel, for eksempel bilirubin, 

afhænger af værdien af en anden variabel, for eksempel behandling, 

men effekterne ændres ikke med tiden. 

(Stratifikation og interaktion kan sagtens kombineres.) 


Forklarende variable i ventetidsanalyser: Stratifikationsvariable 

For stratifikationsvariable afhænger den underliggende rate af hvilken 

værdi, variablen har, dvs. forskellen p˚a individer med X = 1 og 

individer med X = 2 ændres med tiden: 

r(t; X = 1) = r1(t) og r(t; X = 2) = r2(t) 

Konsekvens: 

1. vi kan ikke beskrive effekten med et enkelt tal, 

2. stratifikationsvariable er nødt til at være kategoriske variable 

med et begrænset antal forskellige værdier. 

Ventetidsanalyse Transformation af regressionsvariable 32 

Behov for transformation af regressionsvariable 

• Kriterier og numeriske vurderinger er som i enhver anden 

statistisk model; men 

• grafiske vurderinger er mere kompliceret end for normalt fordelte 

outcomes



Kriterier for valg af parametrisering/transformation 

• Biologisk/medicinsk begrundelse (bedst, men sjældent muligt). 

– Raten vokser eksponentielt med utransformerede kovariater, 

mens en logaritmetransformation af en kovariat betyder, at 

raten vokser med en fast faktor eller procentdel, hver gang 

kovariaten vokser med f.eks. 10%. 

• Transformationer brugt af andre (sammenlignelighed). 

• Den “bedst mulige” transformation for de aktuelle data — pas p˚a: 

signifikansen vil blive overvurderet, og man kan ikke g˚a ud fra, at 

den samme transformation er den mest optimale i andre data — 

men det kan være et fornuftigt kriterium for konfounderne. 


Transformation af serum bilirubin 

PROC UNIVARIATE DATA=skl PCTLDEF=3; * Tjek, om fordelingen er skæv; 

VAR bilirub; 

HISTOGRAM / HEIGHT=5; 

RUN; 



Kriteria for valg af parametrisering/transformation fortsat 

• Se p˚a fordelingen af den forklarende variabel: Nogle f˚a ekstreme 

værdier af den forklarende variabel kan have urimeligt stor 

indflydelse p˚a konklusionerne, medmindre variablen transformeres 

nogle f˚a ekstremt høje → loga(x), 

nogle f˚a ekstremt lave → exp(x/c) (sjældent brugt)]. 

Det bør altid tjekkes, om den valgte transformation “gør 

vold p˚a data”. 

Ved at vælge XX = log(x)/ log(1.1) som kovariat, f˚ar man, at exp( ˆ b) 

(Hazard Ratio) direkte estimerer den faktor, som raten skal ganges med 

for en 10% forskel i kovariaten. 



DATA skl; SET skl; log2Bilirub=LOG2(bilirub); RUN; 

PROC UNIVARIATE DATA=skl PCTLDEF=3; 

VAR log2Bilirub; 

HISTOGRAM / HEIGHT=5; 

RUN;



• Simpelt, numerisk test: Inkluder b˚ade en utransformeret og 

en transformeret version af variablen samtidigt – f.eks. X og 

log2(X) – for at se, om der er et klart svar p˚a hvilken, der er den 

bedste prediktor. Kræver en fornuftigt valg af transformation – 

logaritmetransformation er ofte et oplagt valg, fordi det svarer til 

stabil effekt af relative forskelle, hvilket ofte er det intuitivt 

naturlige valg. 

• Mere kompliceret numerisk og grafisk test: Lineær spline 

(se eksempelvis Greenland 1995, Epidemiology, s. 356-365). 

Eksempel til selvstudium for de særligt eventyrlystne SAS-hajer 

sidst i disse noter (fra s. 80). 



Inklusion af serum bilirubin utransformeret s˚avel som 

logaritmetransformeret: 


MODEL day*bld(0) = sklero bilirub log2bilirub; 

RUN; 

----------------------------------------------------- 



Sklero 1 -0.18290 0.21596 0.7172 0.3971 

Bilirub 1 -0.0001959 0.00231 0.0072 0.9325 

log2Bilirub 1 0.48004 0.18152 6.9939 0.0082 

NB: De bilirubin-relaterede estimater kan ikke umiddelbart fortolkes 

(“ændring i raten, n˚ar bilirubin fordobles samtidigt med, at bilirubin 

holdes fast . . . ”). 

Hvis de begge er signifikante (og betydelige), og det ikke hjælper at tilføje andre 

forklarende variable, s˚a kan effekten bedst illustreres i en graf. 


Plot af sammenhængen med bilirubin som en lineær spline 


Estimation med log2(serum bilirubin) 


MODEL day*bld(0) = sklero log2bilirub / RISKLIMITS; 

RUN; 

--------------------------------------------------- 



Sklero 1 -0.18373 0.21575 0.7252 0.3944 

log2Bilirub 1 0.46716 0.09706 23.1656

Ventetidsanalyse Opsummering 2. del 41 

Opsummering 2. del 

Standard valg af regressionsmodel: 

• Cox’s proportional hazards regressionsmodel 

Forskellige m˚ader variable kan indg˚a p˚a: 

• Via det prognostiske index 

– lineære variable 

– klassevariable 

– interaktion 

• Stratifikation 

Transformation af regressionsvariable: 

• Kriterier for valg af transformation 

• Simpelt numerisk test 

• Grafisk test er mere besværligt 

Ventetidsanalyse Særlig modelkontrol for Cox modellen 43 

Plot af log(kumuleret rate) for grafisk tjek af proportionalitet 


Speciel modelkontrol i Cox modellen 

Cox modellen forudsætter proportionale rater, 

R(t; X) = R0(t) exp(bX), og dermed 

ln(R(t; X)) = ln(R0(t)) + bX 

Grafisk tjek af proportionale rater: Stratificer for hver variabel, en ad 

gangen, og plot 

ln(R stratum (t)) = ln( − ln(S stratum (t)) ) 

som funktion af tiden. Kurverne skal være nogenlunde parallelle. 


SAS kode til grafisk tjek af proportionale rater 

TITLE ’Graphical check of proportionality’; 

PROC PHREG DATA=skl NOPRINT; 

MODEL day*bld(0) = log2bilirub; 

STRATA sklero; 

BASELINE OUT=check LOGLOGS=LCumRate LOGSURV=CumRate 

/ METHOD=CH; 

RUN; 

PROC GPLOT DATA=check; WHERE 0


Numerisk test af proportionalitet ved brug af tidsafhængige variable 

Vælg passende opdeling (her 14 og 105 dage), hvor rate ratioen tillades at 

være forskellig for de forskellige tidsintervaller. Dette gøres v.h.a. dummy 

variable (her SKLFRA14 og SKLFRA105). Proportionalitetsantagelsen testes 

ved at teste, om disse dummy-variable er signifikante: 


MODEL day*bld(0) = log2bilirub sklero SKLfra14 SKLfra105; 

IF sklero=1 AND day>=14 THEN SKLfra14=1; ELSE SKLfra14=0; 

IF sklero=1 AND day>=105 THEN SKLfra105=1; ELSE SKLfra105=0; 

TestProp: TEST SKLfra14, SKLfra105; 

RUN; 

For hvert reblødningstidspunkt beregnes variablene inden i PHREG for hver enkelt af de 

patienter, der er under risiko p˚a netop det tidspunkt (i’erne i nævneren p˚a s. 28). I 

beregningerne for hver enkelt patient i bruger SAS de værdier, som variablene (her 

sklero) har for den enkelte patient i, undtagen for tids-responsvariablen (her day), 

som er lig det aktuelle reblødningstidspunkt tj (reblødningstidspunktet for patient j 

p˚a s. 28) 

Ventetidsanalyse Tidsskalaer 47 

Virkelighedstjek! 

Tid fra stop af seneste blødning har stor betydning for 

sandsynligheden for at begynde at rebløde her og nu 

• dels er det ikke muligt at rebløde, mens den foreg˚aende blødning 

stadig er i gang, 

• dels mindskes sandsynligheden for at rebløde markant med, hvor 

længe det er siden, man blødte sidst. 

Vi har alts˚a to komplikationer: 

1. Patienterne er ikke under risiko fra tid 0 for at blive observeret 

med start p˚a en reblødning i vores studie. 

2. ’Tid’ er ikke bare tid – der er flere tidsskalaer at vælge imellem. 


Del af output fra PROC PHREG 



log2Bilirub 1 0.45833 0.09654 22.5398 ChiSq 

TestProp 1.9445 2 0.3782 


Valg af tidsskala 

Hidtil har vi brugt tid siden randomisering som tid i Cox modellen – 

men reblødningsraten afhænger langt mere af, hvor længe siden det 

er, patienten holdt op med at bløde. 

• Fordelen ved Cox modellen er, at den tillader en vilk˚arlig 

sammenhæng mellem den underliggende rate og den valgte 

tidsskala. 

• Ratioen mellem raterne for to vilk˚arlige patienter i samme 

stratum p˚a et hvilket som helst tidspunkt afhænger kun af 

regressionsvariablene. 

• Egenskaber ved en relevant tidsskala: Der skal være en god grund 

til at tro, at raten ændres med tid siden tid 0 p˚a samme m˚ade for 

alle individer i samme stratum.


Eksempler p˚a tidsskalaer 

• alder 

• kalendertid 

Tidsskalaer 

• tid siden sygdommen begyndte 

• tid fra en eller anden hændelse af stor betydning for raten (her 

tid fra stop af foreg˚aende blødning) 

• tid fra randomisering (kan være problematisk) 

Den eneste forskel for det enkelte individ er definitionen af tid=0, 

men det kan gøre en væsentlig forskel, fordi det kan have stor 

betydning for hvem, der er “under risiko” i studiet, n˚ar den hændelse, 

der er i fokus, sker for et individ. 


Eksempler p˚a forskellige tidsskalaer ved reblødning 

Tid siden randomisering Tid siden slut p˚a første blødning: 


Forskellige tidsskalaer 

Kalendertid: Tid siden indgang i studiet: 


Valg af tidsskala 

Vælg den tidsskala, hvor raten varierer mest (eller mest ujævnt) med tiden 

inden for det tidsinterval, hvor man har observationer! 

Andre tidsskalaer kan indg˚a via regressionsvariable i Cox modellen og/eller 

via stratifikation. Hvis betydningen af en alternativ tidsskala ikke følger 

mønstret “en m˚aned mere betyder altid det samme”, s˚a er det nødvendigt 

enten at stratificere eller at bruge tidsafhængige regressionsvariable (se det 

numeriske test for proportionalitet s. 45 for et eksempel p˚a SAS 

programmering med tidsafhængige variable).


Forsinket indgang 

˚Arsag: Der skal ske et eller andet bestemt for individerne, før det ville 

tælle med i vores analyse, hvis de oplevede vores “outcome” hændelse. 

Dette sker p˚a forskellige tidspunkter for forskellige individer, og det er ikke 

altid sket før tid 0 i den valgte tidsskala. 

Eksempler: 

• for nogle patienter sker randomiseringen efter tid 0 i den valgte 

tidsskala 

• i analyser med tid siden randomisering kan patienterne ikke rebløde, 

før de er holdt op med den første blødning 

• nogen af de forklarende variable kræver en speciel undersøgelse, og 

nogen af patienterne er nødt til at vente p˚a denne undersøgelse 

• for at blive inkluderet skal personerne være i live og “raske” ved 

studiestart 

Ventetidsanalyse Konkurrerende afgangs˚arsager 55 

Virkelighedstjek 2! 

N˚ar vi overhovedet interesserer os for at mindske reblødningsraten, er 

det fordi reblødning er den væsentligste døds˚arsag blandt patienter, 

der en gang har blødt fra ˚areknuder i spiserøret. 

Men patienterne kan jo stadig dø, inden de n˚ar at rebløde! 


Forsinket indgang i SAS 


MODEL tNotBld*bld(0) = log2bilirub sklero 

/ ENTRY=t_entry RISKLIMITS; 

RUN; 

--------------------------------------------- 


Data Set WORK.SKL 

Entry Time Variable t_entry 

Dependent Variable tNotBld 

Censoring Variable Bld 

Censoring Value(s) 0 

Ties Handling BRESLOW 

Percent 


149 86 63 42.28 

: 

Analysis of Maximum Likelihood Estimates 

Parameter Standard Hazard 95% Hazard Ratio 

Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits 

log2Bilirub 1 0.43431 0.09580 20.5534


Separate analyser af de to hændelser 


MODEL tNotBld*bld(0)=sklero log2bilirub ascites / ENTRY=t_entry RL; 

RUN; 


Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits 

Sklero 1 -0.19124 0.22021 0.7542 0.3851 0.826 0.536 1.272 

log2Bilirub 1 0.42240 0.09677 19.0542 ChiSq Ratio Confidence Limits 

Sklero 1 0.17358 0.35173 0.2435 0.6217 1.190 0.597 2.370 

log2Bilirub 1 0.50353 0.14482 12.0890 0.0005 1.655 1.246 2.198 

Ascites 1 0.93763 0.38166 6.0354 0.0140 2.554 1.209 5.396 


Konkurrerende afgangs˚arsager 

Sandsynligheden for, at reblødningen sker efter præcis t dage, er lig 

med 

S(t; X) · r(t; X) 

hvor S(t; X) er sandsynligheden for at være i live til dag t uden at 

have reblødt inden da. 

Konsekvens: 

• Faktorer, som ikke p˚avirker raten for en bestemt slags hændelse, 

kan have en stærk effekt p˚a sandsynligheden for at opleve 

hændelsen via en effekt p˚a raten for en konkurrerende hændelse 

og dermed en effekt p˚a sandsynligheden for at være under risiko. 

• Effekten p˚a sandsynligheden for at opleve hændelsen kan i 

ekstreme tilfælde være modsat rettet effekten p˚a selve raten. 


Sandsynligheden for at være i live uden reblødning 

Hvis de forskellige hændelser kombineres, f˚as en vurdering af effekten 

af de forklarende variable p˚a tid til den første af disse hændelser sker: 

DATA skl; SET skl; 

status = bld + 2*dead; 

RUN; 


MODEL tNotBld*status(0) = sklero log2bilirub ascites / ENTRY=t_entry; 

RUN; 

-------------------------------------------------------------------- 



Sklero 1 -0.08715 0.18555 0.2206 0.6386 0.917 0.637 1.319 

log2Bilirub 1 0.44557 0.08044 30.6819

Censurerede, normalt fordelte data 61 

Censurerede, normalt fordelte data 

Eksempel med SAS programbidder 

– til selvstudium – 

Censurerede, normalt fordelte data (data med detektionsgrænse) 63 

Eksempel p˚a venstrecensurerede data 

M˚alinger af NO2 indendørs og udendørs (Raaschou-Nielsen et al., 1997) 

Vi har 85 sæt af samhørende m˚al for NO2 

1. udenfor gadedøren 

2. i soveværelset 

med en detektionsgrænse p˚a 0.75. 

Vi ønsker at undersøge, hvor stor indflydelse udendørsniveauet har p˚a 

indendørsniveauet. 


Data med detektionsgrænse 

“Venstrecensurering”, dvs. man ved bare, at værdien er under en 

given grænse: 

Baggrundsstøj eller begrænsning i m˚aleudstyrets/assayets følsomhed 

har medført, at man ikke kan skelne mellem meget lave værdier. 

Man tør godt gøre antagelser om fordelingen af de sande m˚alinger, 

eksempelvis at residualerne er normalt fordelt (eventuelt efter 

logaritmetransformation af m˚alingerne). 


Eksempel p˚a venstrecensurerede data 

Samhørende m˚al for NO2 inde og ude 

(under detektionsgrænsen er plottet som lig med detektionsgrænsen)


Estimation af sammenhæng 

Hvad med bare at udelade de “ukendte”? Pas p˚a: Det er selektion 

baseret p˚a responsvariablen! 

DATA no2; SET no2; 

IF UPCASE(UnderDetekt)="JA" THEN inde=.; 

ude_25 = ude - 2.5; * Centrering af variabel ; 

RUN; 

PROC REG DATA=no2; 

Udensmaa: MODEL inde = ude_25; 

RUN; 


Fit uden data under detektionsgrænsen 


Duer ikke p˚a grund af bias. 

Vi mangler alle de laveste indendørsværdier, s˚a linien ligger for højt 

for de lave udendørsværdier, og spredningen undervurderes! 


The REG Procedure 

Model: Udensmaa 

Dependent Variable: INDE 

Analysis of Variance 

Sum of Mean 

Source DF Squares Square F Value Pr>F 

Model 1 9.18865 9.18865 107.71 |t| 

Intercept 1 1.60065 0.03842 41.66


The REG Procedure 

Model: Naiv 

Dependent Variable: INDE 

Analysis of Variance 

Sum of Mean 

Source DF Squares Square F Value Pr>F 

Model 1 18.15521 18.15521 229.66 |t| 

Intercept 1 1.55732 0.03502 44.48


Fit med gæt p˚a gennemsnitsværdi 


Vi ved ikke, om linien ligger for højt (for højt gæt p˚a gennemsnit) 

eller for lavt (for lavt gæt p˚a gennemsnit) for de lave 

udendørsværdier, men spredningen undervurderes stadig. 


I SAS skal der være to variable, der viser de faktiske nedre henholdsvis 

øvre grænser for responsvariablens værdi. 

• For observerede værdier er nedre og øvre grænse lig observationen. 

• For observationer under detektionsgrænsen er den nedre grænse 

ukendt, hvilket angives som et . (missing) i SAS, og den øvre grænse er 

lig med detektionsgrænsen. 

DATA no2; SET no2; 

IF UPCASE(UnderDetekt)="JA" 

THEN DO; 

nedre = .; oevre = 0.75; 

END; 

ELSE DO; 

nedre = inde; oevre = inde; 

END; 

RUN; 

PROC LIFEREG DATA=no2; 

MODEL (nedre, oevre) = ude_25 / DIST=NORMAL NOLOG; 

RUN; 


Korrekt estimation af sammenhæng 

Optimal udnyttelse af data opn˚as ved at inkludere præcis den viden, 

vi har: 

De censurerede data er mindre end detektionsgrænsen. 

Princip: 

• For hver af observationerne under detektionsgrænsen kan det 

udregnes, hvad sandsynligheden er for, at observationen ligger under 

detektionsgrænsen for givne værdier af alle modelparametrene, b˚ade 

regressionsparametrene og variansparameteren. Denne sandsynlighed 

indg˚ar i estimationen. 

• De “almindelige” observationer indg˚ar p˚a sædvanlig vis. 

Alle modelparametrene estimeres som de værdier, der alt i alt passer bedst 

med det observerede, inklusive at observationerne under detektionsgrænsen 

faktisk l˚a under denne grænse. 


The LIFEREG Procedure 


Data Set WORK.NO2 

Dependent Variable nedre 

Dependent Variable oevre 

Number of Observations 85 

Noncensored Values 60 

Right Censored Values 0 

Left Censored Values 25 

Interval Censored Values 0 

Name of Distribution Normal 

Log Likelihood -35.88065877 

Algorithm converged. 

Type III Analysis of Effects 

Wald 

Effect DF Chi-Square Pr > ChiSq 

ude_25 1 177.8626 ChiSq 

Intercept 1245.07


Optimalt fit 



Sammenligning af resultater 

Oversigt over resultaterne af de 4 analyser: 

Ude_25 

Model Parameter Standard 

Estimate Error SD ("Root MSE") 

Udensmaa 0.600 0.058 0.292 

Naiv 0.643 0.042 0.281 

Adhoc 0.738 0.049 0.324 

Optimal 0.785 0.059 0.344 


Estimation af standard deviation 

scale = maximum likelihood estimat for standard deviationen (SD) 

(=residualspredning=prediktionsspredning). For at f˚a noget, der er 

sammenligneligt med det sædvanlige estimat (“ROOT MSE” i SAS 

output), skal der justeres: 

SD* = scale · 

√ n 

n − k − 1 

(n = antal observationer, k = antal kovariater). 

√ 

85 

Her f˚as SD*= 0.340 · 83 = 0.344. 

Lineære splines 80 

SAS kode til lineære splines 

– til selvstudium –


Konstruktion af en lineær spline 

(Pilene viser kvartilerne blandt reblødere) 


Beregning af percentiler blandt reblødere 

PROC UNIVARIATE DATA=skl PCTLDEF=3; WHERE bld=1; 

VAR bilirub; 

RUN; 

Quantile Estimate 

100% Max 495 

99% 495 

95% 177 

90% 146 

75% Q3 73 

50% Median 47 

25% Q1 26 

10% 15 

5% 12 

1% 4 

0% Min 4 


Lineær spline, princip: 

Vi konstruerer nogle variable, der tilsammen summerer til serum 

bilirubin-variablen eventuelt fratrukket et passende tal. Hver variabel 

fanger den del af variationen i serum bilirubin-værdierne, der ligger i et 

præ-defineret interval. 

Af hensyn til den statistiske styrke kan det anbefales at lægge intervallerne, 

s˚a der er ca. lige mange hændelser i hvert interval. 

Her er valgt 4 variable, der summerer til bilirubin−nedre kvartil. 

Interval-endepunkterne (engelsk “knots”) er placeret ved kvartilerne blandt 

rebløderne: 26, 47 og 73 

• b_u26 fanger variationen i bilirubin for værdier under 26 

• b_26_47 fanger variationen i bilirubin for værdier mellem 26 og 47 

• b_47_73 fanger variationen i bilirubin for værdier mellem 47 og 73 

• b_o73 fanger variationen i bilirubin for værdier over 73 


Mulig kode for de nødvendige ekstra variable i SAS 

DATA skl; SET skl; 

IF NOT MISSING(bilirub) AND bilirub


Kort “smart” SAS-kode, der gør det samme 

MIN finder den mindste værdi og MAX finder den største værdi af de 

variable eller tal, der st˚ar i parentesen 

(farverne p˚a variabelnavnene svarer til farverne p˚a liniestykkerne i figuren) 


Estimation og test af lineær spline 

(Kvartilerne blandt reblødere (26, 47, og 73) blev fundet v.h.a. 

PROC UNIVARIATE PCTLDEF=3; WHERE bld=1; VAR bilirub; RUN;) 


MODEL day*bld(0) = 

b_u26 b_26_47 b_47_73 b_o73 sklero 

/ RISKLIMITS; 

TestLine: TEST b_u26=b_26_47=b_47_73=b_o73; 

RUN; 


Plot af de kovariater, der indg˚ar i den “smarte” kode 


Estimation og test af lineær spline fortsat 



b_u26 1 -0.01390 0.03276 0.1801 0.6712 0.986 0.925 1.052 

b_26_47 1 0.03250 0.02161 2.2618 0.1326 1.033 0.990 1.078 

b_47_73 1 0.03483 0.01412 6.0838 0.0136 1.035 1.007 1.065 

b_o73 1 0.00162 0.00161 1.0189 0.3128 1.002 0.998 1.005 

Sklero 1 -0.13197 0.21954 0.3613 0.5478 0.876 0.570 1.348 

Linear Hypotheses Testing Results 

Label Wald Chi-Square DF Pr > ChiSq 

TestLine 15.7811 3 0.0013 

“Parameter Estimate” er hældningen for ln(rate ratio) indenfor 

hvert af intervallerne. “Hazard Ratio” er derfor et m˚al for den 

interval-specifikke dosis-respons relation.


Plot af lineær spline: Datasæt, der skal plottes 

5 og 95 percentilerne for bilirubin blandt reblødere er 12 og 177 

DATA plot; 

DO bili=12, 26, 47, 73, 177; * Knækpunkter og endepunkter; 

* Variabelværdier svarende til knæk- og endepunkter beregnes ; 

b_u26=MIN(bili-26,0); 

b_o26=MAX(bili-26,0); 


b_26_47=b_o26-b_o47; 


b_47_73=b_o47-b_o73; 

* Parameterestimaterne fra outputtet ganges p˚a de tilsvarende variable ; 

* for at udregne den prædikterede værdi af det Prognostiske Index ; 

* (eksponenten i Cox modellen) ; 

pi = -0.01390*b_u26 +0.03250*b_26_47 

+0.03483*b_47_73 +0.00162*b_o73; 

rr = EXP(pi); * PI omregnes til Rate Ratio ; 

OUTPUT; 

END; 

RUN; 


Plot af lineær spline 

Eksempel p˚a et kald af PROC GPLOT med SYMBOL og AXIS statements: 

SYMBOL1 C=BLACK V=CIRCLE I=JOIN L=1; 

AXIS1 LABEL=(F=CENTX ’Bilirubin’) ; 

AXIS2 LABEL=(F=CENTX A=90 R=0 ’Rate ratio’) 

LOGBASE=2 INTERVAL=UNEVEN; 

PROC GPLOT DATA=plot; 

PLOT rr*bili / HAXIS=AXIS1 VAXIS=AXIS2; 

RUN;

Overlevelsesanalyse

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?