28.07.2013 Views

Overlevelsesanalyse

Overlevelsesanalyse

Overlevelsesanalyse

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Ventetidsanalyse<br />

(“<strong>Overlevelsesanalyse</strong>”)<br />

Birthe Lykke Thomsen<br />

Det Nationale Forskningscenter for Arbejdsmiljø<br />

Ventetidsanalyse Baggrund 3<br />

Data:<br />

Randomiseret studie af patienter, der har blødt én<br />

gang. Respons er, hvorn˚ar patienten rebløder.<br />

(EVASP, 1984)<br />

Ventetidsanalyse Baggrund 2<br />

˚Areknuder i spiserøret er en alvorlig følgesygdom, der kan optræde<br />

hos patienter med levercirrose. Hvis en af ˚areknuderne brister, er<br />

patienten i alvorlig risiko for at dø af den indvendige blødning.<br />

Forskningsspørgsm˚al: Vi ønsker at undersøge, om<br />

skleroterapi kan bruges til at udskyde forekomsten af<br />

reblødning hos patienter med blødende ˚areknuder i<br />

spiserøret p.g.a. levercirrose.<br />

Ventetidsanalyse Baggrund 4<br />

Særlige egenskaber ved denne slags data<br />

• Respons: tid til en given hændelse – her reblødning; men det<br />

kunne ogs˚a være død, sygdom, helbredelse, tilbagefald,<br />

graviditet, . . .<br />

– gør det særligt interessant at lave simple modeller for<br />

sandsynligheden for, at noget sker p˚a et givet tidspunkt<br />

forudsat, at personen p˚a det tidspunkt er under risiko for, at<br />

det sker<br />

– disse betingede sandsynligheder kaldes rater eller hazards<br />

– typisk kigger man efter multiplikative effekter p˚a raten – det<br />

kaldes Cox’s proportional hazards model<br />

– hvis (og kun hvis) raten er konstant, kan den estimeres ved<br />

antal hændelser/samlet risikotid<br />

(standard formel fra epidemiologi) og effekter estimeres ved<br />

Poisson regression (ikke med p˚a basal statistik kurset)


Ventetidsanalyse Baggrund 5<br />

Særlige egenskaber ved denne slags data fortsat<br />

• Forsinket indgang og censurering: Vi har kun en større eller<br />

mindre bid af hvert individs liv med i vores studie<br />

– forsinket indgang: nogle personer er ikke med fra start<br />

– censurering: for nogle af individerne ved vi kun, at det<br />

endnu ikke var sket, da de gik ud af studiet<br />

• og vi m˚a kun bruge den tid, hvor vi ville tælle<br />

hændelsen med, n˚ar/hvis den skete<br />

Ventetidsanalyse Baggrund 7<br />

Særlige metoder kan h˚andtere denne slags data<br />

Fordi raten er i fokus, ser man p˚a hvert tidspunkt, et ad gangen, og<br />

opsummerer derefter i en<br />

• Kaplan-Meier kurve<br />

• kumuleret (summeret) rate<br />

• Cox regression<br />

Ventetidsanalyse Baggrund 6<br />

Særlige egenskaber ved denne slags data fortsat<br />

• Oftest ingen anelse om fordelingen af tid til hændelsen<br />

– den er i praksis stort set aldrig normalt fordelt<br />

(for censurerede, normalt fordelte data, f.eks. outcomes med<br />

detektionsgrænse, bruges PROC LIFEREG; se s. 61–79 i disse noter til<br />

selvstudium)<br />

– det kan nogle gange være rimeligt at tro, at raten er konstant<br />

– en forudsætning for mange epidemiologiske vurderinger<br />

• men det er altid en forudsætning, at censurering er uafhængig af<br />

outcome givet de kendte, forklarende variable – censurering m˚a<br />

ikke være prædiktivt for, om hændelsen ellers snart ville<br />

ske<br />

Ventetidsanalyse Kaplan-Meier 8<br />

Reblødning i de to grupper: Kaplan-Meier og kumuleret rate<br />

uden henholdsvis med punktvise konfidensgrænser


Ventetidsanalyse Kaplan-Meier 9<br />

Fortolkning af Kaplan-Meier og kumuleret rate<br />

Hvis hændelsen er “død af hvilken som helst ˚arsag”, s˚a viser<br />

Kaplan-Meier kurven overlevelsessandsynligheden som funktion af<br />

tiden t, dvs. hvor stor en andel, man kan regne med vil overleve<br />

mindst til tid t.<br />

Hvis hændelsen er hvad som helst andet, og død har medført<br />

censurering, s˚a giver Kaplan-Meier kurven ingen fornuftig mening!<br />

Den kumulerede rate har ingen direkte, intuitiv fortolkning. Den er<br />

ikke lig sandsynligheden for, at hændelsen sker inden det givne<br />

tidspunkt – men det er en tilnærmelse, n˚ar den kumulerede rate er<br />

lille. Hældningen p˚a den kumulerede rate er lig med selve raten.<br />

Rater og kumulerede rater er korrekte, ogs˚a n˚ar død medfører<br />

censurering!<br />

Ventetidsanalyse Kaplan-Meier 11<br />

Beregning af Kaplan-Meier og kumuleret rate<br />

(alt under bølgelinien er skjult for os, og kun de grønne personer er med fra start)<br />

Ventetidsanalyse Kaplan-Meier 10<br />

Reblødning i de to grupper – standard plots<br />

Trappekurve: et trin ned hver gang,<br />

der sker en hændelse.<br />

S(T ) ≈ exp(−R(T ))<br />

R(T ) ≈ − ln(S(T ))<br />

(Stykkevis) konstant rate giver<br />

(stykkevis) lineær kumuleret rate R(t).<br />

For tidsintervaller med lineær R(t) kan<br />

selve raten estimeres som forskellen<br />

mellem startværdi og slutværdi for<br />

R(t) divideret med længden af<br />

tidsintervallet.<br />

Høj rate=stejl hældning,<br />

lav rate=flad kurve.<br />

Ventetidsanalyse Kaplan-Meier 12<br />

Beregning af Kaplan-Meier og kumuleret rate<br />

P˚a en given dag t observerer vi for hver gruppe g (kaldes<br />

sædvanligvis “stratum”, flertal “strata”, i ventetidsanalyse)<br />

1. ng(t) individer totalt<br />

2. mg(t) individer, der begynder at rebløde<br />

hvilket giver den daglige reblødningsrate<br />

rg(t) = mg(t)<br />

ng(t)<br />

Kaplan-Meier estimatet Sg(T ) p˚a dag T for gruppe g beregnes ved<br />

at gange leddene 1 − rg(t) sammen for alle dage t op til og med dag T .<br />

Nelson-Aalen estimatet for den kumulerede reblødningsrate Rg(T )<br />

p˚a dag T for gruppe g beregnes ved at lægge de daglige<br />

reblødningsrater sammen for alle dage t op til og med dag T .


Ventetidsanalyse Kaplan-Meier 13<br />

Estimation af Kaplan-Meier kurver v.h.a. PHREG<br />

Respons:<br />

“Det tidspunkt, hændelsen sker”; men det sker<br />

ikke for alle, s˚a det er nødvendigt at bruge en<br />

kombination af 2 responsvariable:<br />

“tid” og “hvad skete der”.<br />

Datasættet SKL indeholder (bl.a.)<br />

DAY: tid for udgang<br />

BLD:<br />

1 for reblødning,<br />

0 for censurering<br />

SKLERO:<br />

1 for skleroterapigruppen,<br />

0 for den medicinsk behandlede gruppe<br />

PROC PHREG DATA=skl NOPRINT;<br />

MODEL Day*Bld(0) = ;<br />

STRATA Sklero;<br />

BASELINE<br />

OUT=km<br />

SURVIVAL=KMcurves<br />

LOWER=LowerBound<br />

UPPER=UpperBound<br />

/ METHOD=PL CLTYPE=LOGLOG;<br />

RUN;<br />

SYMBOL1 C=BLACK V=NONE I=STEPLJ;<br />

SYMBOL2 C=RED V=NONE I=STEPLJ;<br />

PROC GPLOT DATA=km;<br />

PLOT kmcurves*day=sklero;<br />

RUN;<br />

Ventetidsanalyse Log rank 15<br />

Log rank test (svarende til en-sidet variansanalyse)<br />

Grupper kan sammenlignes v.h.a. et log rank test.<br />

Princip (for 2 grupper):<br />

Vi forudsætter (“nul-hypotesen”), at der ingen forskel er p˚a de 2<br />

grupper, og betinger for hvert ’døds’tidspunkt med<br />

• det observerede totale antal ’døde’ m(ti) (= m1(ti) + m2(ti))<br />

• antallet af personer under risiko p˚a det givne tidspunkt i hver af<br />

de 2 grupper, n1(ti) og n2(ti) (n1(ti) + n2(ti) = n(ti))<br />

For gruppe 1 kan vi s˚a for hvert ’døds’tidspunkt ti beregne<br />

• det forventede antal ’døde’ E1(ti) = m(ti) · n1(ti)<br />

n(ti)<br />

• variansen p˚a antallet af ’døde’<br />

V (ti) = n1(ti)<br />

n(ti)<br />

· n2(ti)<br />

n(ti)<br />

· m(ti)·(n(ti)−m(ti))<br />

(n(ti)−1)<br />

Ventetidsanalyse Kaplan-Meier 14<br />

Ekstra SAS kode for at f˚a konfidensgrænser med fra PHREG<br />

SAS kode for nødvendige<br />

datamodifikationer:<br />

DATA km; SET km;<br />

IF sklero=0 THEN DO;<br />

type=1; curve=kmcurves; OUTPUT;<br />

type=2; curve=lowerbound; OUTPUT;<br />

type=3; curve=upperbound; OUTPUT;<br />

END;<br />

IF sklero=1 THEN DO;<br />

type=4; curve=kmcurves; OUTPUT;<br />

type=5; curve=lowerbound; OUTPUT;<br />

type=6; curve=upperbound; OUTPUT;<br />

END;<br />

RUN;<br />

Eksempel p˚a kald af GPLOT:<br />

PROC GPLOT DATA=km;<br />

PLOT curve*day=type<br />

/ HAXIS=AXIS1 VAXIS=AXIS2 NOLEGEND;<br />

SYMBOL1 R=1 C=BLACK V=NONE I=STEPLJ L=1 W=5;<br />

SYMBOL2 R=2 C=BLACK V=NONE I=STEPLJ L=33;<br />

SYMBOL3 R=1 C=RED V=NONE I=STEPLJ L=1 W=5;<br />

SYMBOL4 R=2 C=RED V=NONE I=STEPLJ L=35;<br />

AXIS1 LABEL = (’Dage fra randomisering’);<br />

AXIS2 LABEL = (A=90 R=0 ’S(t) = Kaplan-Meier’);<br />

RUN;<br />

(Alternativ SAS procedure.<br />

PROC LIFETEST DATA=skl PLOTS=(S) CONFTYPE=loglog; TIME day*bld(0); STRATA sklero; RUN;<br />

NB: Den duer ikke ved forsinket indgang!)<br />

Ventetidsanalyse Log rank 16<br />

Log rank test fortsat<br />

De forventede antal ’døde’ E1(ti), henholdsvis varianserne V (ti), adderes<br />

for alle ’døds’tidspunkter ti til E1, henholdsvis V . Desuden tælles det<br />

totale antal observerede ’døde’ M1 i gruppe 1.<br />

Log rank teststørelsen<br />

Log Rank Chi Square = (M1 − E1) 2<br />

,<br />

V<br />

er χ 2 -fordelt med 1 frihedsgrad.<br />

Tilnærmelse, der ogs˚a kan bruges for mere end 2 grupper, her G grupper:<br />

G∑ (Mg − Eg)<br />

Log Rank Chi Square ≈<br />

2<br />

,<br />

er χ 2 -fordelt med G − 1 frihedsgrader (bemærk, at alle grupper bidrager<br />

til summen).<br />

g=1<br />

Eg


Ventetidsanalyse Styrkeberegning 17<br />

Styrkeberegning for ventetidsdata<br />

Summen af varianserne, V , brugt ved beregningen af log rank<br />

teststørrelsen, bruges ogs˚a ved styrkeberegninger:<br />

Hvis man ønsker at kunne p˚avise en rate ratio p˚a RR for aktiv versus<br />

kontrol med et tosidet signifikansniveau p˚a α og en styrke p˚a 1−β, s˚a skal<br />

man inkludere tilstrækkeligt mange personer til, at V ≥<br />

( Uα/2 +U β<br />

ln(RR)<br />

(Ux=(1−x)-fraktilen i en normal fordeling, eksempelvis U 2.5%=1.96,<br />

U 5%=1.645, U 10%=1.282, U 20%=0.842)<br />

Hvis randomiseringsratioen (aktiv:kontrol) er a:1, og hændelsen er sjælden,<br />

er V ≈ a<br />

(a+1) 2 · M, hvor M=total antal hændelser, dvs. der skal inkluderes<br />

tilstrækkeligt mange personer til, at<br />

M ≥<br />

(a + 1)2<br />

a<br />

·<br />

( ) 2<br />

Uα/2 + Uβ<br />

ln(RR)<br />

Ventetidsanalyse Log rank 19<br />

Dele af output fra PROC PHREG<br />

The PHREG Procedure<br />

Model Information<br />

Data Set WORK.SKL<br />

Dependent Variable Day<br />

Censoring Variable Bld<br />

Censoring Value(s) 0<br />

Ties Handling DISCRETE<br />

Summary of the Number of Event and Censored Values<br />

Percent<br />

Total Event Censored Censored<br />

187 91 96 51.34<br />

Model Fit Statistics<br />

Without With<br />

Criterion Covariates Covariates<br />

-2 LOG L 738.406 737.488<br />

: : :<br />

Testing Global Null Hypothesis: BETA=0<br />

Test Chi-Square DF Pr > ChiSq<br />

Likelihood Ratio 0.9175 1 0.3381<br />

Score 0.9174 1 0.3382<br />

Wald 0.9124 1 0.3395<br />

) 2<br />

.<br />

Ventetidsanalyse Log rank 18<br />

Log rank test ved hjælp af PROC PHREG<br />

Log rank teststørrelsen kan beregnes som score-teststørrelsen i<br />

PROC PHREG med brug af option TIES=DISCRETE:<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) = sklero / TIES=DISCRETE;<br />

RUN;<br />

Hvis der er mere end 2 grupper, er det nødvendigt at bruge et CLASS statement,<br />

eksempelvis<br />

PROC PHREG DATA=skl;<br />

CLASS sklero;<br />

MODEL day*bld(0) = sklero / TIES=DISCRETE;<br />

RUN;<br />

Ventetidsanalyse Log rank 20<br />

Log rank teststørrelse=0.9174, p=0.3382, findes ud for “Score”<br />

under “Testing Global Null Hypothesis: BETA=0”<br />

Output fra PROC PHREG fortsat<br />

Analysis of Maximum Likelihood Estimates<br />

Parameter Standard Hazard<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio<br />

Sklero 1 -0.20261 0.21212 0.9124 0.3395 0.817<br />

Log rank testet er d˚arligt til at detektere forskelle, der<br />

ændres markant med tiden, som en d˚arligere<br />

korttidsprognose samtidigt med en bedre langtidsprognose!


Ventetidsanalyse Opsummering 1. del 21<br />

Ventetidsdata karakteristika:<br />

Opsummering 1. del<br />

• “et tidspunkt ad gangen”: vi laver modeller for raten<br />

• censurering og forsinket indgang<br />

• ingen fordelingsantagelser<br />

Typisk grafik:<br />

• Kaplan-Meier (pas p˚a!)<br />

• kumuleret rate – tjek for stykkevis linearitet<br />

Sammenligning af grupper (det, der svarer til ensidet<br />

variansanalyse):<br />

• log rank test – d˚arligt til at detektere tidsvarierende effekter<br />

Ventetidsanalyse Cox model 23<br />

Cox’s regression model<br />

Denne model kaldes Cox’s regression model:<br />

r(t; X1, X2, . . . , Xk) = r0(t) · exp(b1X1 + b2X2 + . . . + bkXk)<br />

Summen i eksponenten, b1X1 + b2X2 + . . . + bkXk, kaldes ofte det<br />

“prognostiske indeks”.<br />

Hvis vi logaritmetransformerer og skriver b0(t) for ln(r0(t)), f˚as<br />

noget, der ligner de sædvanlige regressionsmodeller:<br />

ln(r(t; X1, X2, . . . , Xk)) = b0(t) + b1X1 + b2X2 + . . . + bkXk<br />

Bemærk, at logaritmen til den underliggende rate r0(t) svarer til den<br />

sædvanlige intercept parameter (der alts˚a afhænger af tiden her)!<br />

Ventetidsanalyse Cox model 22<br />

Proportionale rater<br />

Kvantificering af behandlingseffekten:<br />

r(t; sklero) = r(t; medicinsk) · B<br />

Effekt af ascites (væske i bughulen):<br />

r(t; ascites) = r(t; ingen ascites) · A<br />

Kombineret:<br />

r(t; sklero, ascites) = r(t; medicinsk, ascites) · B<br />

= r(t; medicinsk, ingen ascites) · A · B<br />

= r(t; medicinsk, ingen ascites) · exp(a + b)<br />

med a=ln(A) og b=ln(B).<br />

0 ∼ ingen ascites<br />

Sættes X1 = {<br />

1 ∼ ascites<br />

s˚a er<br />

0 ∼ og X2 = { medicinsk<br />

1 ∼ skleroterapi<br />

r(t; sklero, ascites) = r0(t) · exp(aX1 + bX2)<br />

Ventetidsanalyse Cox model 24<br />

En positiv værdi for en regressionsparameter bj betyder, at høje<br />

værdier af den tilsvarende kovariat Xj hører sammen med høj rate:<br />

For uønskede hændelser betyder det, at høje værdier forværrer<br />

prognosen, s˚a vær meget forsigtig med at bruge ordene<br />

“positiv/negativ” om effekter, brug eksempelvis “gavnlig/skadelig”.


Ventetidsanalyse Cox model 25<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) = ascites bilirub sklero / RISKLIMITS;<br />

RUN;<br />

---------------------------------------------------------<br />

Summary of the Number of Event and Censored Values<br />

Percent<br />

Total Event Censored Censored<br />

177 87 90 50.85<br />

Parameter Standard<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq<br />

Ascites 1 0.18072 0.22721 0.6326 0.4264<br />

Bilirub 1 0.00476 0.00112 18.1500 ChiSq<br />

Asc_Bili 21.2800 2


Ventetidsanalyse Specielle aspekter ved Cox modellen 29<br />

Forklarende variable i ventetidsanalyser: Regressionsvariable<br />

Regressionsvariable indg˚ar udelukkende via eksponenten, exp(bX), og<br />

ikke i den underliggende rate r0(t). Med andre ord, raterne antages<br />

at være proportionale for forskellige værdier af variablen, X:<br />

r(t; X = 1) = r0(t) · exp(b) og<br />

r(t; X = 2) = r0(t) · exp(2b) = r(t; X = 1) · exp(b)<br />

Konsekvens:<br />

1. effekten kan beskrive med et eneste tal (exp(b)),<br />

2. men dette tal er kun meningsfuldt, hvis antagelsen om<br />

proportionale rater holder (tilnærmelsesvis).<br />

Ventetidsanalyse Specielle aspekter ved Cox modellen 31<br />

Statifikation versus Interaktion<br />

Stratifikation er ikke det samme som interaktion! Effekten af<br />

stratifikationsvariablen ændres med tiden, men effekten afhænger ikke<br />

af de øvrige variable, og deres effekter antages at være identiske i de<br />

forskellige strata — i modsætning til den epidemiologiske brug af<br />

udtrykket “stratificerede analyser”, som betyder helt separate<br />

analyser for hver værdi af stratifikationsvariablen!!<br />

Interaktion betyder, at effekten af en variabel, for eksempel bilirubin,<br />

afhænger af værdien af en anden variabel, for eksempel behandling,<br />

men effekterne ændres ikke med tiden.<br />

(Stratifikation og interaktion kan sagtens kombineres.)<br />

Ventetidsanalyse Specielle aspekter ved Cox modellen 30<br />

Forklarende variable i ventetidsanalyser: Stratifikationsvariable<br />

For stratifikationsvariable afhænger den underliggende rate af hvilken<br />

værdi, variablen har, dvs. forskellen p˚a individer med X = 1 og<br />

individer med X = 2 ændres med tiden:<br />

r(t; X = 1) = r1(t) og r(t; X = 2) = r2(t)<br />

Konsekvens:<br />

1. vi kan ikke beskrive effekten med et enkelt tal,<br />

2. stratifikationsvariable er nødt til at være kategoriske variable<br />

med et begrænset antal forskellige værdier.<br />

Ventetidsanalyse Transformation af regressionsvariable 32<br />

Behov for transformation af regressionsvariable<br />

• Kriterier og numeriske vurderinger er som i enhver anden<br />

statistisk model; men<br />

• grafiske vurderinger er mere kompliceret end for normalt fordelte<br />

outcomes


Ventetidsanalyse Transformation af regressionsvariable 33<br />

Behov for transformation af regressionsvariable<br />

Kriterier for valg af parametrisering/transformation<br />

• Biologisk/medicinsk begrundelse (bedst, men sjældent muligt).<br />

– Raten vokser eksponentielt med utransformerede kovariater,<br />

mens en logaritmetransformation af en kovariat betyder, at<br />

raten vokser med en fast faktor eller procentdel, hver gang<br />

kovariaten vokser med f.eks. 10%.<br />

• Transformationer brugt af andre (sammenlignelighed).<br />

• Den “bedst mulige” transformation for de aktuelle data — pas p˚a:<br />

signifikansen vil blive overvurderet, og man kan ikke g˚a ud fra, at<br />

den samme transformation er den mest optimale i andre data —<br />

men det kan være et fornuftigt kriterium for konfounderne.<br />

Ventetidsanalyse Transformation af regressionsvariable 35<br />

Transformation af serum bilirubin<br />

PROC UNIVARIATE DATA=skl PCTLDEF=3; * Tjek, om fordelingen er skæv;<br />

VAR bilirub;<br />

HISTOGRAM / HEIGHT=5;<br />

RUN;<br />

Ventetidsanalyse Transformation af regressionsvariable 34<br />

Behov for transformation af regressionsvariable<br />

Kriteria for valg af parametrisering/transformation fortsat<br />

• Se p˚a fordelingen af den forklarende variabel: Nogle f˚a ekstreme<br />

værdier af den forklarende variabel kan have urimeligt stor<br />

indflydelse p˚a konklusionerne, medmindre variablen transformeres<br />

nogle f˚a ekstremt høje → loga(x),<br />

nogle f˚a ekstremt lave → exp(x/c) (sjældent brugt)].<br />

Det bør altid tjekkes, om den valgte transformation “gør<br />

vold p˚a data”.<br />

Ved at vælge XX = log(x)/ log(1.1) som kovariat, f˚ar man, at exp( ˆ b)<br />

(Hazard Ratio) direkte estimerer den faktor, som raten skal ganges med<br />

for en 10% forskel i kovariaten.<br />

Ventetidsanalyse Transformation af regressionsvariable 36<br />

Transformation af serum bilirubin<br />

DATA skl; SET skl; log2Bilirub=LOG2(bilirub); RUN;<br />

PROC UNIVARIATE DATA=skl PCTLDEF=3;<br />

VAR log2Bilirub;<br />

HISTOGRAM / HEIGHT=5;<br />

RUN;


Ventetidsanalyse Transformation af regressionsvariable 37<br />

Behov for transformation af regressionsvariable<br />

• Simpelt, numerisk test: Inkluder b˚ade en utransformeret og<br />

en transformeret version af variablen samtidigt – f.eks. X og<br />

log2(X) – for at se, om der er et klart svar p˚a hvilken, der er den<br />

bedste prediktor. Kræver en fornuftigt valg af transformation –<br />

logaritmetransformation er ofte et oplagt valg, fordi det svarer til<br />

stabil effekt af relative forskelle, hvilket ofte er det intuitivt<br />

naturlige valg.<br />

• Mere kompliceret numerisk og grafisk test: Lineær spline<br />

(se eksempelvis Greenland 1995, Epidemiology, s. 356-365).<br />

Eksempel til selvstudium for de særligt eventyrlystne SAS-hajer<br />

sidst i disse noter (fra s. 80).<br />

Ventetidsanalyse Transformation af regressionsvariable 39<br />

Transformation af serum bilirubin<br />

Inklusion af serum bilirubin utransformeret s˚avel som<br />

logaritmetransformeret:<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) = sklero bilirub log2bilirub;<br />

RUN;<br />

-----------------------------------------------------<br />

Parameter Standard<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq<br />

Sklero 1 -0.18290 0.21596 0.7172 0.3971<br />

Bilirub 1 -0.0001959 0.00231 0.0072 0.9325<br />

log2Bilirub 1 0.48004 0.18152 6.9939 0.0082<br />

NB: De bilirubin-relaterede estimater kan ikke umiddelbart fortolkes<br />

(“ændring i raten, n˚ar bilirubin fordobles samtidigt med, at bilirubin<br />

holdes fast . . . ”).<br />

Hvis de begge er signifikante (og betydelige), og det ikke hjælper at tilføje andre<br />

forklarende variable, s˚a kan effekten bedst illustreres i en graf.<br />

Ventetidsanalyse Transformation af regressionsvariable 38<br />

Plot af sammenhængen med bilirubin som en lineær spline<br />

Ventetidsanalyse Transformation af regressionsvariable 40<br />

Estimation med log2(serum bilirubin)<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) = sklero log2bilirub / RISKLIMITS;<br />

RUN;<br />

---------------------------------------------------<br />

Parameter Standard<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq<br />

Sklero 1 -0.18373 0.21575 0.7252 0.3944<br />

log2Bilirub 1 0.46716 0.09706 23.1656


Ventetidsanalyse Opsummering 2. del 41<br />

Opsummering 2. del<br />

Standard valg af regressionsmodel:<br />

• Cox’s proportional hazards regressionsmodel<br />

Forskellige m˚ader variable kan indg˚a p˚a:<br />

• Via det prognostiske index<br />

– lineære variable<br />

– klassevariable<br />

– interaktion<br />

• Stratifikation<br />

Transformation af regressionsvariable:<br />

• Kriterier for valg af transformation<br />

• Simpelt numerisk test<br />

• Grafisk test er mere besværligt<br />

Ventetidsanalyse Særlig modelkontrol for Cox modellen 43<br />

Plot af log(kumuleret rate) for grafisk tjek af proportionalitet<br />

Ventetidsanalyse Særlig modelkontrol for Cox modellen 42<br />

Speciel modelkontrol i Cox modellen<br />

Cox modellen forudsætter proportionale rater,<br />

R(t; X) = R0(t) exp(bX), og dermed<br />

ln(R(t; X)) = ln(R0(t)) + bX<br />

Grafisk tjek af proportionale rater: Stratificer for hver variabel, en ad<br />

gangen, og plot<br />

ln(R stratum (t)) = ln( − ln(S stratum (t)) )<br />

som funktion af tiden. Kurverne skal være nogenlunde parallelle.<br />

Ventetidsanalyse Særlig modelkontrol for Cox modellen 44<br />

SAS kode til grafisk tjek af proportionale rater<br />

TITLE ’Graphical check of proportionality’;<br />

PROC PHREG DATA=skl NOPRINT;<br />

MODEL day*bld(0) = log2bilirub;<br />

STRATA sklero;<br />

BASELINE OUT=check LOGLOGS=LCumRate LOGSURV=CumRate<br />

/ METHOD=CH;<br />

RUN;<br />

PROC GPLOT DATA=check; WHERE 0


Ventetidsanalyse Særlig modelkontrol for Cox modellen 45<br />

Numerisk test af proportionalitet ved brug af tidsafhængige variable<br />

Vælg passende opdeling (her 14 og 105 dage), hvor rate ratioen tillades at<br />

være forskellig for de forskellige tidsintervaller. Dette gøres v.h.a. dummy<br />

variable (her SKLFRA14 og SKLFRA105). Proportionalitetsantagelsen testes<br />

ved at teste, om disse dummy-variable er signifikante:<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) = log2bilirub sklero SKLfra14 SKLfra105;<br />

IF sklero=1 AND day>=14 THEN SKLfra14=1; ELSE SKLfra14=0;<br />

IF sklero=1 AND day>=105 THEN SKLfra105=1; ELSE SKLfra105=0;<br />

TestProp: TEST SKLfra14, SKLfra105;<br />

RUN;<br />

For hvert reblødningstidspunkt beregnes variablene inden i PHREG for hver enkelt af de<br />

patienter, der er under risiko p˚a netop det tidspunkt (i’erne i nævneren p˚a s. 28). I<br />

beregningerne for hver enkelt patient i bruger SAS de værdier, som variablene (her<br />

sklero) har for den enkelte patient i, undtagen for tids-responsvariablen (her day),<br />

som er lig det aktuelle reblødningstidspunkt tj (reblødningstidspunktet for patient j<br />

p˚a s. 28)<br />

Ventetidsanalyse Tidsskalaer 47<br />

Virkelighedstjek!<br />

Tid fra stop af seneste blødning har stor betydning for<br />

sandsynligheden for at begynde at rebløde her og nu<br />

• dels er det ikke muligt at rebløde, mens den foreg˚aende blødning<br />

stadig er i gang,<br />

• dels mindskes sandsynligheden for at rebløde markant med, hvor<br />

længe det er siden, man blødte sidst.<br />

Vi har alts˚a to komplikationer:<br />

1. Patienterne er ikke under risiko fra tid 0 for at blive observeret<br />

med start p˚a en reblødning i vores studie.<br />

2. ’Tid’ er ikke bare tid – der er flere tidsskalaer at vælge imellem.<br />

Ventetidsanalyse Særlig modelkontrol for Cox modellen 46<br />

Del af output fra PROC PHREG<br />

Parameter Standard<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq<br />

log2Bilirub 1 0.45833 0.09654 22.5398 ChiSq<br />

TestProp 1.9445 2 0.3782<br />

Ventetidsanalyse Tidsskalaer 48<br />

Valg af tidsskala<br />

Hidtil har vi brugt tid siden randomisering som tid i Cox modellen –<br />

men reblødningsraten afhænger langt mere af, hvor længe siden det<br />

er, patienten holdt op med at bløde.<br />

• Fordelen ved Cox modellen er, at den tillader en vilk˚arlig<br />

sammenhæng mellem den underliggende rate og den valgte<br />

tidsskala.<br />

• Ratioen mellem raterne for to vilk˚arlige patienter i samme<br />

stratum p˚a et hvilket som helst tidspunkt afhænger kun af<br />

regressionsvariablene.<br />

• Egenskaber ved en relevant tidsskala: Der skal være en god grund<br />

til at tro, at raten ændres med tid siden tid 0 p˚a samme m˚ade for<br />

alle individer i samme stratum.


Ventetidsanalyse Tidsskalaer 49<br />

Eksempler p˚a tidsskalaer<br />

• alder<br />

• kalendertid<br />

Tidsskalaer<br />

• tid siden sygdommen begyndte<br />

• tid fra en eller anden hændelse af stor betydning for raten (her<br />

tid fra stop af foreg˚aende blødning)<br />

• tid fra randomisering (kan være problematisk)<br />

Den eneste forskel for det enkelte individ er definitionen af tid=0,<br />

men det kan gøre en væsentlig forskel, fordi det kan have stor<br />

betydning for hvem, der er “under risiko” i studiet, n˚ar den hændelse,<br />

der er i fokus, sker for et individ.<br />

Ventetidsanalyse Tidsskalaer 51<br />

Eksempler p˚a forskellige tidsskalaer ved reblødning<br />

Tid siden randomisering Tid siden slut p˚a første blødning:<br />

Ventetidsanalyse Tidsskalaer 50<br />

Forskellige tidsskalaer<br />

Kalendertid: Tid siden indgang i studiet:<br />

Ventetidsanalyse Tidsskalaer 52<br />

Valg af tidsskala<br />

Vælg den tidsskala, hvor raten varierer mest (eller mest ujævnt) med tiden<br />

inden for det tidsinterval, hvor man har observationer!<br />

Andre tidsskalaer kan indg˚a via regressionsvariable i Cox modellen og/eller<br />

via stratifikation. Hvis betydningen af en alternativ tidsskala ikke følger<br />

mønstret “en m˚aned mere betyder altid det samme”, s˚a er det nødvendigt<br />

enten at stratificere eller at bruge tidsafhængige regressionsvariable (se det<br />

numeriske test for proportionalitet s. 45 for et eksempel p˚a SAS<br />

programmering med tidsafhængige variable).


Ventetidsanalyse Tidsskalaer 53<br />

Forsinket indgang<br />

˚Arsag: Der skal ske et eller andet bestemt for individerne, før det ville<br />

tælle med i vores analyse, hvis de oplevede vores “outcome” hændelse.<br />

Dette sker p˚a forskellige tidspunkter for forskellige individer, og det er ikke<br />

altid sket før tid 0 i den valgte tidsskala.<br />

Eksempler:<br />

• for nogle patienter sker randomiseringen efter tid 0 i den valgte<br />

tidsskala<br />

• i analyser med tid siden randomisering kan patienterne ikke rebløde,<br />

før de er holdt op med den første blødning<br />

• nogen af de forklarende variable kræver en speciel undersøgelse, og<br />

nogen af patienterne er nødt til at vente p˚a denne undersøgelse<br />

• for at blive inkluderet skal personerne være i live og “raske” ved<br />

studiestart<br />

Ventetidsanalyse Konkurrerende afgangs˚arsager 55<br />

Virkelighedstjek 2!<br />

N˚ar vi overhovedet interesserer os for at mindske reblødningsraten, er<br />

det fordi reblødning er den væsentligste døds˚arsag blandt patienter,<br />

der en gang har blødt fra ˚areknuder i spiserøret.<br />

Men patienterne kan jo stadig dø, inden de n˚ar at rebløde!<br />

Ventetidsanalyse Tidsskalaer 54<br />

Forsinket indgang i SAS<br />

PROC PHREG DATA=skl;<br />

MODEL tNotBld*bld(0) = log2bilirub sklero<br />

/ ENTRY=t_entry RISKLIMITS;<br />

RUN;<br />

---------------------------------------------<br />

Model Information<br />

Data Set WORK.SKL<br />

Entry Time Variable t_entry<br />

Dependent Variable tNotBld<br />

Censoring Variable Bld<br />

Censoring Value(s) 0<br />

Ties Handling BRESLOW<br />

Percent<br />

Total Event Censored Censored<br />

149 86 63 42.28<br />

:<br />

Analysis of Maximum Likelihood Estimates<br />

Parameter Standard Hazard 95% Hazard Ratio<br />

Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits<br />

log2Bilirub 1 0.43431 0.09580 20.5534


Ventetidsanalyse Konkurrerende afgangs˚arsager 57<br />

Separate analyser af de to hændelser<br />

PROC PHREG DATA=skl;<br />

MODEL tNotBld*bld(0)=sklero log2bilirub ascites / ENTRY=t_entry RL;<br />

RUN;<br />

Parameter Standard Hazard 95% Hazard Ratio<br />

Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />

Sklero 1 -0.19124 0.22021 0.7542 0.3851 0.826 0.536 1.272<br />

log2Bilirub 1 0.42240 0.09677 19.0542 ChiSq Ratio Confidence Limits<br />

Sklero 1 0.17358 0.35173 0.2435 0.6217 1.190 0.597 2.370<br />

log2Bilirub 1 0.50353 0.14482 12.0890 0.0005 1.655 1.246 2.198<br />

Ascites 1 0.93763 0.38166 6.0354 0.0140 2.554 1.209 5.396<br />

Ventetidsanalyse Konkurrerende afgangs˚arsager 59<br />

Konkurrerende afgangs˚arsager<br />

Sandsynligheden for, at reblødningen sker efter præcis t dage, er lig<br />

med<br />

S(t; X) · r(t; X)<br />

hvor S(t; X) er sandsynligheden for at være i live til dag t uden at<br />

have reblødt inden da.<br />

Konsekvens:<br />

• Faktorer, som ikke p˚avirker raten for en bestemt slags hændelse,<br />

kan have en stærk effekt p˚a sandsynligheden for at opleve<br />

hændelsen via en effekt p˚a raten for en konkurrerende hændelse<br />

og dermed en effekt p˚a sandsynligheden for at være under risiko.<br />

• Effekten p˚a sandsynligheden for at opleve hændelsen kan i<br />

ekstreme tilfælde være modsat rettet effekten p˚a selve raten.<br />

Ventetidsanalyse Konkurrerende afgangs˚arsager 58<br />

Sandsynligheden for at være i live uden reblødning<br />

Hvis de forskellige hændelser kombineres, f˚as en vurdering af effekten<br />

af de forklarende variable p˚a tid til den første af disse hændelser sker:<br />

DATA skl; SET skl;<br />

status = bld + 2*dead;<br />

RUN;<br />

PROC PHREG DATA=skl;<br />

MODEL tNotBld*status(0) = sklero log2bilirub ascites / ENTRY=t_entry;<br />

RUN;<br />

--------------------------------------------------------------------<br />

Parameter Standard Hazard 95% Hazard Ratio<br />

Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />

Sklero 1 -0.08715 0.18555 0.2206 0.6386 0.917 0.637 1.319<br />

log2Bilirub 1 0.44557 0.08044 30.6819


Censurerede, normalt fordelte data 61<br />

Censurerede, normalt fordelte data<br />

Eksempel med SAS programbidder<br />

– til selvstudium –<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 63<br />

Eksempel p˚a venstrecensurerede data<br />

M˚alinger af NO2 indendørs og udendørs (Raaschou-Nielsen et al., 1997)<br />

Vi har 85 sæt af samhørende m˚al for NO2<br />

1. udenfor gadedøren<br />

2. i soveværelset<br />

med en detektionsgrænse p˚a 0.75.<br />

Vi ønsker at undersøge, hvor stor indflydelse udendørsniveauet har p˚a<br />

indendørsniveauet.<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 62<br />

Data med detektionsgrænse<br />

“Venstrecensurering”, dvs. man ved bare, at værdien er under en<br />

given grænse:<br />

Baggrundsstøj eller begrænsning i m˚aleudstyrets/assayets følsomhed<br />

har medført, at man ikke kan skelne mellem meget lave værdier.<br />

Man tør godt gøre antagelser om fordelingen af de sande m˚alinger,<br />

eksempelvis at residualerne er normalt fordelt (eventuelt efter<br />

logaritmetransformation af m˚alingerne).<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 64<br />

Eksempel p˚a venstrecensurerede data<br />

Samhørende m˚al for NO2 inde og ude<br />

(under detektionsgrænsen er plottet som lig med detektionsgrænsen)


Censurerede, normalt fordelte data (data med detektionsgrænse) 65<br />

Estimation af sammenhæng<br />

Hvad med bare at udelade de “ukendte”? Pas p˚a: Det er selektion<br />

baseret p˚a responsvariablen!<br />

DATA no2; SET no2;<br />

IF UPCASE(UnderDetekt)="JA" THEN inde=.;<br />

ude_25 = ude - 2.5; * Centrering af variabel ;<br />

RUN;<br />

PROC REG DATA=no2;<br />

Udensmaa: MODEL inde = ude_25;<br />

RUN;<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 67<br />

Fit uden data under detektionsgrænsen<br />

Samhørende m˚al for NO2 inde og ude<br />

Duer ikke p˚a grund af bias.<br />

Vi mangler alle de laveste indendørsværdier, s˚a linien ligger for højt<br />

for de lave udendørsværdier, og spredningen undervurderes!<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 66<br />

The REG Procedure<br />

Model: Udensmaa<br />

Dependent Variable: INDE<br />

Analysis of Variance<br />

Sum of Mean<br />

Source DF Squares Square F Value Pr>F<br />

Model 1 9.18865 9.18865 107.71 |t|<br />

Intercept 1 1.60065 0.03842 41.66


Censurerede, normalt fordelte data (data med detektionsgrænse) 69<br />

The REG Procedure<br />

Model: Naiv<br />

Dependent Variable: INDE<br />

Analysis of Variance<br />

Sum of Mean<br />

Source DF Squares Square F Value Pr>F<br />

Model 1 18.15521 18.15521 229.66 |t|<br />

Intercept 1 1.55732 0.03502 44.48


Censurerede, normalt fordelte data (data med detektionsgrænse) 73<br />

Fit med gæt p˚a gennemsnitsværdi<br />

Samhørende m˚al for NO2 inde og ude<br />

Vi ved ikke, om linien ligger for højt (for højt gæt p˚a gennemsnit)<br />

eller for lavt (for lavt gæt p˚a gennemsnit) for de lave<br />

udendørsværdier, men spredningen undervurderes stadig.<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 75<br />

I SAS skal der være to variable, der viser de faktiske nedre henholdsvis<br />

øvre grænser for responsvariablens værdi.<br />

• For observerede værdier er nedre og øvre grænse lig observationen.<br />

• For observationer under detektionsgrænsen er den nedre grænse<br />

ukendt, hvilket angives som et . (missing) i SAS, og den øvre grænse er<br />

lig med detektionsgrænsen.<br />

DATA no2; SET no2;<br />

IF UPCASE(UnderDetekt)="JA"<br />

THEN DO;<br />

nedre = .; oevre = 0.75;<br />

END;<br />

ELSE DO;<br />

nedre = inde; oevre = inde;<br />

END;<br />

RUN;<br />

PROC LIFEREG DATA=no2;<br />

MODEL (nedre, oevre) = ude_25 / DIST=NORMAL NOLOG;<br />

RUN;<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 74<br />

Korrekt estimation af sammenhæng<br />

Optimal udnyttelse af data opn˚as ved at inkludere præcis den viden,<br />

vi har:<br />

De censurerede data er mindre end detektionsgrænsen.<br />

Princip:<br />

• For hver af observationerne under detektionsgrænsen kan det<br />

udregnes, hvad sandsynligheden er for, at observationen ligger under<br />

detektionsgrænsen for givne værdier af alle modelparametrene, b˚ade<br />

regressionsparametrene og variansparameteren. Denne sandsynlighed<br />

indg˚ar i estimationen.<br />

• De “almindelige” observationer indg˚ar p˚a sædvanlig vis.<br />

Alle modelparametrene estimeres som de værdier, der alt i alt passer bedst<br />

med det observerede, inklusive at observationerne under detektionsgrænsen<br />

faktisk l˚a under denne grænse.<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 76<br />

The LIFEREG Procedure<br />

Model Information<br />

Data Set WORK.NO2<br />

Dependent Variable nedre<br />

Dependent Variable oevre<br />

Number of Observations 85<br />

Noncensored Values 60<br />

Right Censored Values 0<br />

Left Censored Values 25<br />

Interval Censored Values 0<br />

Name of Distribution Normal<br />

Log Likelihood -35.88065877<br />

Algorithm converged.<br />

Type III Analysis of Effects<br />

Wald<br />

Effect DF Chi-Square Pr > ChiSq<br />

ude_25 1 177.8626 ChiSq<br />

Intercept 1245.07


Censurerede, normalt fordelte data (data med detektionsgrænse) 77<br />

Optimalt fit<br />

Samhørende m˚al for NO2 inde og ude<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 79<br />

Sammenligning af resultater<br />

Oversigt over resultaterne af de 4 analyser:<br />

Ude_25<br />

Model Parameter Standard<br />

Estimate Error SD ("Root MSE")<br />

Udensmaa 0.600 0.058 0.292<br />

Naiv 0.643 0.042 0.281<br />

Adhoc 0.738 0.049 0.324<br />

Optimal 0.785 0.059 0.344<br />

Censurerede, normalt fordelte data (data med detektionsgrænse) 78<br />

Estimation af standard deviation<br />

scale = maximum likelihood estimat for standard deviationen (SD)<br />

(=residualspredning=prediktionsspredning). For at f˚a noget, der er<br />

sammenligneligt med det sædvanlige estimat (“ROOT MSE” i SAS<br />

output), skal der justeres:<br />

SD* = scale ·<br />

√ n<br />

n − k − 1<br />

(n = antal observationer, k = antal kovariater).<br />

√<br />

85<br />

Her f˚as SD*= 0.340 · 83 = 0.344.<br />

Lineære splines 80<br />

SAS kode til lineære splines<br />

– til selvstudium –


Lineære splines 81<br />

Konstruktion af en lineær spline<br />

(Pilene viser kvartilerne blandt reblødere)<br />

Lineære splines 83<br />

Beregning af percentiler blandt reblødere<br />

PROC UNIVARIATE DATA=skl PCTLDEF=3; WHERE bld=1;<br />

VAR bilirub;<br />

RUN;<br />

Quantile Estimate<br />

100% Max 495<br />

99% 495<br />

95% 177<br />

90% 146<br />

75% Q3 73<br />

50% Median 47<br />

25% Q1 26<br />

10% 15<br />

5% 12<br />

1% 4<br />

0% Min 4<br />

Lineære splines 82<br />

Lineær spline, princip:<br />

Vi konstruerer nogle variable, der tilsammen summerer til serum<br />

bilirubin-variablen eventuelt fratrukket et passende tal. Hver variabel<br />

fanger den del af variationen i serum bilirubin-værdierne, der ligger i et<br />

præ-defineret interval.<br />

Af hensyn til den statistiske styrke kan det anbefales at lægge intervallerne,<br />

s˚a der er ca. lige mange hændelser i hvert interval.<br />

Her er valgt 4 variable, der summerer til bilirubin−nedre kvartil.<br />

Interval-endepunkterne (engelsk “knots”) er placeret ved kvartilerne blandt<br />

rebløderne: 26, 47 og 73<br />

• b_u26 fanger variationen i bilirubin for værdier under 26<br />

• b_26_47 fanger variationen i bilirubin for værdier mellem 26 og 47<br />

• b_47_73 fanger variationen i bilirubin for værdier mellem 47 og 73<br />

• b_o73 fanger variationen i bilirubin for værdier over 73<br />

Lineære splines 84<br />

Mulig kode for de nødvendige ekstra variable i SAS<br />

DATA skl; SET skl;<br />

IF NOT MISSING(bilirub) AND bilirub


Lineære splines 85<br />

Kort “smart” SAS-kode, der gør det samme<br />

MIN finder den mindste værdi og MAX finder den største værdi af de<br />

variable eller tal, der st˚ar i parentesen<br />

(farverne p˚a variabelnavnene svarer til farverne p˚a liniestykkerne i figuren)<br />

Lineære splines 87<br />

Estimation og test af lineær spline<br />

(Kvartilerne blandt reblødere (26, 47, og 73) blev fundet v.h.a.<br />

PROC UNIVARIATE PCTLDEF=3; WHERE bld=1; VAR bilirub; RUN;)<br />

PROC PHREG DATA=skl;<br />

MODEL day*bld(0) =<br />

b_u26 b_26_47 b_47_73 b_o73 sklero<br />

/ RISKLIMITS;<br />

TestLine: TEST b_u26=b_26_47=b_47_73=b_o73;<br />

RUN;<br />

Lineære splines 86<br />

Plot af de kovariater, der indg˚ar i den “smarte” kode<br />

Lineære splines 88<br />

Estimation og test af lineær spline fortsat<br />

Parameter Standard Hazard 95% Hazard Ratio<br />

Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />

b_u26 1 -0.01390 0.03276 0.1801 0.6712 0.986 0.925 1.052<br />

b_26_47 1 0.03250 0.02161 2.2618 0.1326 1.033 0.990 1.078<br />

b_47_73 1 0.03483 0.01412 6.0838 0.0136 1.035 1.007 1.065<br />

b_o73 1 0.00162 0.00161 1.0189 0.3128 1.002 0.998 1.005<br />

Sklero 1 -0.13197 0.21954 0.3613 0.5478 0.876 0.570 1.348<br />

Linear Hypotheses Testing Results<br />

Label Wald Chi-Square DF Pr > ChiSq<br />

TestLine 15.7811 3 0.0013<br />

“Parameter Estimate” er hældningen for ln(rate ratio) indenfor<br />

hvert af intervallerne. “Hazard Ratio” er derfor et m˚al for den<br />

interval-specifikke dosis-respons relation.


Lineære splines 89<br />

Plot af lineær spline: Datasæt, der skal plottes<br />

5 og 95 percentilerne for bilirubin blandt reblødere er 12 og 177<br />

DATA plot;<br />

DO bili=12, 26, 47, 73, 177; * Knækpunkter og endepunkter;<br />

* Variabelværdier svarende til knæk- og endepunkter beregnes ;<br />

b_u26=MIN(bili-26,0);<br />

b_o26=MAX(bili-26,0);<br />

b_o47=MAX(bili-47,0);<br />

b_26_47=b_o26-b_o47;<br />

b_o73=MAX(bili-73,0);<br />

b_47_73=b_o47-b_o73;<br />

* Parameterestimaterne fra outputtet ganges p˚a de tilsvarende variable ;<br />

* for at udregne den prædikterede værdi af det Prognostiske Index ;<br />

* (eksponenten i Cox modellen) ;<br />

pi = -0.01390*b_u26 +0.03250*b_26_47<br />

+0.03483*b_47_73 +0.00162*b_o73;<br />

rr = EXP(pi); * PI omregnes til Rate Ratio ;<br />

OUTPUT;<br />

END;<br />

RUN;<br />

Lineære splines 90<br />

Plot af lineær spline<br />

Eksempel p˚a et kald af PROC GPLOT med SYMBOL og AXIS statements:<br />

SYMBOL1 C=BLACK V=CIRCLE I=JOIN L=1;<br />

AXIS1 LABEL=(F=CENTX ’Bilirubin’) ;<br />

AXIS2 LABEL=(F=CENTX A=90 R=0 ’Rate ratio’)<br />

LOGBASE=2 INTERVAL=UNEVEN;<br />

PROC GPLOT DATA=plot;<br />

PLOT rr*bili / HAXIS=AXIS1 VAXIS=AXIS2;<br />

RUN;

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!