Overlevelsesanalyse
Overlevelsesanalyse
Overlevelsesanalyse
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Ventetidsanalyse<br />
(“<strong>Overlevelsesanalyse</strong>”)<br />
Birthe Lykke Thomsen<br />
Det Nationale Forskningscenter for Arbejdsmiljø<br />
Ventetidsanalyse Baggrund 3<br />
Data:<br />
Randomiseret studie af patienter, der har blødt én<br />
gang. Respons er, hvorn˚ar patienten rebløder.<br />
(EVASP, 1984)<br />
Ventetidsanalyse Baggrund 2<br />
˚Areknuder i spiserøret er en alvorlig følgesygdom, der kan optræde<br />
hos patienter med levercirrose. Hvis en af ˚areknuderne brister, er<br />
patienten i alvorlig risiko for at dø af den indvendige blødning.<br />
Forskningsspørgsm˚al: Vi ønsker at undersøge, om<br />
skleroterapi kan bruges til at udskyde forekomsten af<br />
reblødning hos patienter med blødende ˚areknuder i<br />
spiserøret p.g.a. levercirrose.<br />
Ventetidsanalyse Baggrund 4<br />
Særlige egenskaber ved denne slags data<br />
• Respons: tid til en given hændelse – her reblødning; men det<br />
kunne ogs˚a være død, sygdom, helbredelse, tilbagefald,<br />
graviditet, . . .<br />
– gør det særligt interessant at lave simple modeller for<br />
sandsynligheden for, at noget sker p˚a et givet tidspunkt<br />
forudsat, at personen p˚a det tidspunkt er under risiko for, at<br />
det sker<br />
– disse betingede sandsynligheder kaldes rater eller hazards<br />
– typisk kigger man efter multiplikative effekter p˚a raten – det<br />
kaldes Cox’s proportional hazards model<br />
– hvis (og kun hvis) raten er konstant, kan den estimeres ved<br />
antal hændelser/samlet risikotid<br />
(standard formel fra epidemiologi) og effekter estimeres ved<br />
Poisson regression (ikke med p˚a basal statistik kurset)
Ventetidsanalyse Baggrund 5<br />
Særlige egenskaber ved denne slags data fortsat<br />
• Forsinket indgang og censurering: Vi har kun en større eller<br />
mindre bid af hvert individs liv med i vores studie<br />
– forsinket indgang: nogle personer er ikke med fra start<br />
– censurering: for nogle af individerne ved vi kun, at det<br />
endnu ikke var sket, da de gik ud af studiet<br />
• og vi m˚a kun bruge den tid, hvor vi ville tælle<br />
hændelsen med, n˚ar/hvis den skete<br />
Ventetidsanalyse Baggrund 7<br />
Særlige metoder kan h˚andtere denne slags data<br />
Fordi raten er i fokus, ser man p˚a hvert tidspunkt, et ad gangen, og<br />
opsummerer derefter i en<br />
• Kaplan-Meier kurve<br />
• kumuleret (summeret) rate<br />
• Cox regression<br />
Ventetidsanalyse Baggrund 6<br />
Særlige egenskaber ved denne slags data fortsat<br />
• Oftest ingen anelse om fordelingen af tid til hændelsen<br />
– den er i praksis stort set aldrig normalt fordelt<br />
(for censurerede, normalt fordelte data, f.eks. outcomes med<br />
detektionsgrænse, bruges PROC LIFEREG; se s. 61–79 i disse noter til<br />
selvstudium)<br />
– det kan nogle gange være rimeligt at tro, at raten er konstant<br />
– en forudsætning for mange epidemiologiske vurderinger<br />
• men det er altid en forudsætning, at censurering er uafhængig af<br />
outcome givet de kendte, forklarende variable – censurering m˚a<br />
ikke være prædiktivt for, om hændelsen ellers snart ville<br />
ske<br />
Ventetidsanalyse Kaplan-Meier 8<br />
Reblødning i de to grupper: Kaplan-Meier og kumuleret rate<br />
uden henholdsvis med punktvise konfidensgrænser
Ventetidsanalyse Kaplan-Meier 9<br />
Fortolkning af Kaplan-Meier og kumuleret rate<br />
Hvis hændelsen er “død af hvilken som helst ˚arsag”, s˚a viser<br />
Kaplan-Meier kurven overlevelsessandsynligheden som funktion af<br />
tiden t, dvs. hvor stor en andel, man kan regne med vil overleve<br />
mindst til tid t.<br />
Hvis hændelsen er hvad som helst andet, og død har medført<br />
censurering, s˚a giver Kaplan-Meier kurven ingen fornuftig mening!<br />
Den kumulerede rate har ingen direkte, intuitiv fortolkning. Den er<br />
ikke lig sandsynligheden for, at hændelsen sker inden det givne<br />
tidspunkt – men det er en tilnærmelse, n˚ar den kumulerede rate er<br />
lille. Hældningen p˚a den kumulerede rate er lig med selve raten.<br />
Rater og kumulerede rater er korrekte, ogs˚a n˚ar død medfører<br />
censurering!<br />
Ventetidsanalyse Kaplan-Meier 11<br />
Beregning af Kaplan-Meier og kumuleret rate<br />
(alt under bølgelinien er skjult for os, og kun de grønne personer er med fra start)<br />
Ventetidsanalyse Kaplan-Meier 10<br />
Reblødning i de to grupper – standard plots<br />
Trappekurve: et trin ned hver gang,<br />
der sker en hændelse.<br />
S(T ) ≈ exp(−R(T ))<br />
R(T ) ≈ − ln(S(T ))<br />
(Stykkevis) konstant rate giver<br />
(stykkevis) lineær kumuleret rate R(t).<br />
For tidsintervaller med lineær R(t) kan<br />
selve raten estimeres som forskellen<br />
mellem startværdi og slutværdi for<br />
R(t) divideret med længden af<br />
tidsintervallet.<br />
Høj rate=stejl hældning,<br />
lav rate=flad kurve.<br />
Ventetidsanalyse Kaplan-Meier 12<br />
Beregning af Kaplan-Meier og kumuleret rate<br />
P˚a en given dag t observerer vi for hver gruppe g (kaldes<br />
sædvanligvis “stratum”, flertal “strata”, i ventetidsanalyse)<br />
1. ng(t) individer totalt<br />
2. mg(t) individer, der begynder at rebløde<br />
hvilket giver den daglige reblødningsrate<br />
rg(t) = mg(t)<br />
ng(t)<br />
Kaplan-Meier estimatet Sg(T ) p˚a dag T for gruppe g beregnes ved<br />
at gange leddene 1 − rg(t) sammen for alle dage t op til og med dag T .<br />
Nelson-Aalen estimatet for den kumulerede reblødningsrate Rg(T )<br />
p˚a dag T for gruppe g beregnes ved at lægge de daglige<br />
reblødningsrater sammen for alle dage t op til og med dag T .
Ventetidsanalyse Kaplan-Meier 13<br />
Estimation af Kaplan-Meier kurver v.h.a. PHREG<br />
Respons:<br />
“Det tidspunkt, hændelsen sker”; men det sker<br />
ikke for alle, s˚a det er nødvendigt at bruge en<br />
kombination af 2 responsvariable:<br />
“tid” og “hvad skete der”.<br />
Datasættet SKL indeholder (bl.a.)<br />
DAY: tid for udgang<br />
BLD:<br />
1 for reblødning,<br />
0 for censurering<br />
SKLERO:<br />
1 for skleroterapigruppen,<br />
0 for den medicinsk behandlede gruppe<br />
PROC PHREG DATA=skl NOPRINT;<br />
MODEL Day*Bld(0) = ;<br />
STRATA Sklero;<br />
BASELINE<br />
OUT=km<br />
SURVIVAL=KMcurves<br />
LOWER=LowerBound<br />
UPPER=UpperBound<br />
/ METHOD=PL CLTYPE=LOGLOG;<br />
RUN;<br />
SYMBOL1 C=BLACK V=NONE I=STEPLJ;<br />
SYMBOL2 C=RED V=NONE I=STEPLJ;<br />
PROC GPLOT DATA=km;<br />
PLOT kmcurves*day=sklero;<br />
RUN;<br />
Ventetidsanalyse Log rank 15<br />
Log rank test (svarende til en-sidet variansanalyse)<br />
Grupper kan sammenlignes v.h.a. et log rank test.<br />
Princip (for 2 grupper):<br />
Vi forudsætter (“nul-hypotesen”), at der ingen forskel er p˚a de 2<br />
grupper, og betinger for hvert ’døds’tidspunkt med<br />
• det observerede totale antal ’døde’ m(ti) (= m1(ti) + m2(ti))<br />
• antallet af personer under risiko p˚a det givne tidspunkt i hver af<br />
de 2 grupper, n1(ti) og n2(ti) (n1(ti) + n2(ti) = n(ti))<br />
For gruppe 1 kan vi s˚a for hvert ’døds’tidspunkt ti beregne<br />
• det forventede antal ’døde’ E1(ti) = m(ti) · n1(ti)<br />
n(ti)<br />
• variansen p˚a antallet af ’døde’<br />
V (ti) = n1(ti)<br />
n(ti)<br />
· n2(ti)<br />
n(ti)<br />
· m(ti)·(n(ti)−m(ti))<br />
(n(ti)−1)<br />
Ventetidsanalyse Kaplan-Meier 14<br />
Ekstra SAS kode for at f˚a konfidensgrænser med fra PHREG<br />
SAS kode for nødvendige<br />
datamodifikationer:<br />
DATA km; SET km;<br />
IF sklero=0 THEN DO;<br />
type=1; curve=kmcurves; OUTPUT;<br />
type=2; curve=lowerbound; OUTPUT;<br />
type=3; curve=upperbound; OUTPUT;<br />
END;<br />
IF sklero=1 THEN DO;<br />
type=4; curve=kmcurves; OUTPUT;<br />
type=5; curve=lowerbound; OUTPUT;<br />
type=6; curve=upperbound; OUTPUT;<br />
END;<br />
RUN;<br />
Eksempel p˚a kald af GPLOT:<br />
PROC GPLOT DATA=km;<br />
PLOT curve*day=type<br />
/ HAXIS=AXIS1 VAXIS=AXIS2 NOLEGEND;<br />
SYMBOL1 R=1 C=BLACK V=NONE I=STEPLJ L=1 W=5;<br />
SYMBOL2 R=2 C=BLACK V=NONE I=STEPLJ L=33;<br />
SYMBOL3 R=1 C=RED V=NONE I=STEPLJ L=1 W=5;<br />
SYMBOL4 R=2 C=RED V=NONE I=STEPLJ L=35;<br />
AXIS1 LABEL = (’Dage fra randomisering’);<br />
AXIS2 LABEL = (A=90 R=0 ’S(t) = Kaplan-Meier’);<br />
RUN;<br />
(Alternativ SAS procedure.<br />
PROC LIFETEST DATA=skl PLOTS=(S) CONFTYPE=loglog; TIME day*bld(0); STRATA sklero; RUN;<br />
NB: Den duer ikke ved forsinket indgang!)<br />
Ventetidsanalyse Log rank 16<br />
Log rank test fortsat<br />
De forventede antal ’døde’ E1(ti), henholdsvis varianserne V (ti), adderes<br />
for alle ’døds’tidspunkter ti til E1, henholdsvis V . Desuden tælles det<br />
totale antal observerede ’døde’ M1 i gruppe 1.<br />
Log rank teststørelsen<br />
Log Rank Chi Square = (M1 − E1) 2<br />
,<br />
V<br />
er χ 2 -fordelt med 1 frihedsgrad.<br />
Tilnærmelse, der ogs˚a kan bruges for mere end 2 grupper, her G grupper:<br />
G∑ (Mg − Eg)<br />
Log Rank Chi Square ≈<br />
2<br />
,<br />
er χ 2 -fordelt med G − 1 frihedsgrader (bemærk, at alle grupper bidrager<br />
til summen).<br />
g=1<br />
Eg
Ventetidsanalyse Styrkeberegning 17<br />
Styrkeberegning for ventetidsdata<br />
Summen af varianserne, V , brugt ved beregningen af log rank<br />
teststørrelsen, bruges ogs˚a ved styrkeberegninger:<br />
Hvis man ønsker at kunne p˚avise en rate ratio p˚a RR for aktiv versus<br />
kontrol med et tosidet signifikansniveau p˚a α og en styrke p˚a 1−β, s˚a skal<br />
man inkludere tilstrækkeligt mange personer til, at V ≥<br />
( Uα/2 +U β<br />
ln(RR)<br />
(Ux=(1−x)-fraktilen i en normal fordeling, eksempelvis U 2.5%=1.96,<br />
U 5%=1.645, U 10%=1.282, U 20%=0.842)<br />
Hvis randomiseringsratioen (aktiv:kontrol) er a:1, og hændelsen er sjælden,<br />
er V ≈ a<br />
(a+1) 2 · M, hvor M=total antal hændelser, dvs. der skal inkluderes<br />
tilstrækkeligt mange personer til, at<br />
M ≥<br />
(a + 1)2<br />
a<br />
·<br />
( ) 2<br />
Uα/2 + Uβ<br />
ln(RR)<br />
Ventetidsanalyse Log rank 19<br />
Dele af output fra PROC PHREG<br />
The PHREG Procedure<br />
Model Information<br />
Data Set WORK.SKL<br />
Dependent Variable Day<br />
Censoring Variable Bld<br />
Censoring Value(s) 0<br />
Ties Handling DISCRETE<br />
Summary of the Number of Event and Censored Values<br />
Percent<br />
Total Event Censored Censored<br />
187 91 96 51.34<br />
Model Fit Statistics<br />
Without With<br />
Criterion Covariates Covariates<br />
-2 LOG L 738.406 737.488<br />
: : :<br />
Testing Global Null Hypothesis: BETA=0<br />
Test Chi-Square DF Pr > ChiSq<br />
Likelihood Ratio 0.9175 1 0.3381<br />
Score 0.9174 1 0.3382<br />
Wald 0.9124 1 0.3395<br />
) 2<br />
.<br />
Ventetidsanalyse Log rank 18<br />
Log rank test ved hjælp af PROC PHREG<br />
Log rank teststørrelsen kan beregnes som score-teststørrelsen i<br />
PROC PHREG med brug af option TIES=DISCRETE:<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) = sklero / TIES=DISCRETE;<br />
RUN;<br />
Hvis der er mere end 2 grupper, er det nødvendigt at bruge et CLASS statement,<br />
eksempelvis<br />
PROC PHREG DATA=skl;<br />
CLASS sklero;<br />
MODEL day*bld(0) = sklero / TIES=DISCRETE;<br />
RUN;<br />
Ventetidsanalyse Log rank 20<br />
Log rank teststørrelse=0.9174, p=0.3382, findes ud for “Score”<br />
under “Testing Global Null Hypothesis: BETA=0”<br />
Output fra PROC PHREG fortsat<br />
Analysis of Maximum Likelihood Estimates<br />
Parameter Standard Hazard<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio<br />
Sklero 1 -0.20261 0.21212 0.9124 0.3395 0.817<br />
Log rank testet er d˚arligt til at detektere forskelle, der<br />
ændres markant med tiden, som en d˚arligere<br />
korttidsprognose samtidigt med en bedre langtidsprognose!
Ventetidsanalyse Opsummering 1. del 21<br />
Ventetidsdata karakteristika:<br />
Opsummering 1. del<br />
• “et tidspunkt ad gangen”: vi laver modeller for raten<br />
• censurering og forsinket indgang<br />
• ingen fordelingsantagelser<br />
Typisk grafik:<br />
• Kaplan-Meier (pas p˚a!)<br />
• kumuleret rate – tjek for stykkevis linearitet<br />
Sammenligning af grupper (det, der svarer til ensidet<br />
variansanalyse):<br />
• log rank test – d˚arligt til at detektere tidsvarierende effekter<br />
Ventetidsanalyse Cox model 23<br />
Cox’s regression model<br />
Denne model kaldes Cox’s regression model:<br />
r(t; X1, X2, . . . , Xk) = r0(t) · exp(b1X1 + b2X2 + . . . + bkXk)<br />
Summen i eksponenten, b1X1 + b2X2 + . . . + bkXk, kaldes ofte det<br />
“prognostiske indeks”.<br />
Hvis vi logaritmetransformerer og skriver b0(t) for ln(r0(t)), f˚as<br />
noget, der ligner de sædvanlige regressionsmodeller:<br />
ln(r(t; X1, X2, . . . , Xk)) = b0(t) + b1X1 + b2X2 + . . . + bkXk<br />
Bemærk, at logaritmen til den underliggende rate r0(t) svarer til den<br />
sædvanlige intercept parameter (der alts˚a afhænger af tiden her)!<br />
Ventetidsanalyse Cox model 22<br />
Proportionale rater<br />
Kvantificering af behandlingseffekten:<br />
r(t; sklero) = r(t; medicinsk) · B<br />
Effekt af ascites (væske i bughulen):<br />
r(t; ascites) = r(t; ingen ascites) · A<br />
Kombineret:<br />
r(t; sklero, ascites) = r(t; medicinsk, ascites) · B<br />
= r(t; medicinsk, ingen ascites) · A · B<br />
= r(t; medicinsk, ingen ascites) · exp(a + b)<br />
med a=ln(A) og b=ln(B).<br />
0 ∼ ingen ascites<br />
Sættes X1 = {<br />
1 ∼ ascites<br />
s˚a er<br />
0 ∼ og X2 = { medicinsk<br />
1 ∼ skleroterapi<br />
r(t; sklero, ascites) = r0(t) · exp(aX1 + bX2)<br />
Ventetidsanalyse Cox model 24<br />
En positiv værdi for en regressionsparameter bj betyder, at høje<br />
værdier af den tilsvarende kovariat Xj hører sammen med høj rate:<br />
For uønskede hændelser betyder det, at høje værdier forværrer<br />
prognosen, s˚a vær meget forsigtig med at bruge ordene<br />
“positiv/negativ” om effekter, brug eksempelvis “gavnlig/skadelig”.
Ventetidsanalyse Cox model 25<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) = ascites bilirub sklero / RISKLIMITS;<br />
RUN;<br />
---------------------------------------------------------<br />
Summary of the Number of Event and Censored Values<br />
Percent<br />
Total Event Censored Censored<br />
177 87 90 50.85<br />
Parameter Standard<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq<br />
Ascites 1 0.18072 0.22721 0.6326 0.4264<br />
Bilirub 1 0.00476 0.00112 18.1500 ChiSq<br />
Asc_Bili 21.2800 2
Ventetidsanalyse Specielle aspekter ved Cox modellen 29<br />
Forklarende variable i ventetidsanalyser: Regressionsvariable<br />
Regressionsvariable indg˚ar udelukkende via eksponenten, exp(bX), og<br />
ikke i den underliggende rate r0(t). Med andre ord, raterne antages<br />
at være proportionale for forskellige værdier af variablen, X:<br />
r(t; X = 1) = r0(t) · exp(b) og<br />
r(t; X = 2) = r0(t) · exp(2b) = r(t; X = 1) · exp(b)<br />
Konsekvens:<br />
1. effekten kan beskrive med et eneste tal (exp(b)),<br />
2. men dette tal er kun meningsfuldt, hvis antagelsen om<br />
proportionale rater holder (tilnærmelsesvis).<br />
Ventetidsanalyse Specielle aspekter ved Cox modellen 31<br />
Statifikation versus Interaktion<br />
Stratifikation er ikke det samme som interaktion! Effekten af<br />
stratifikationsvariablen ændres med tiden, men effekten afhænger ikke<br />
af de øvrige variable, og deres effekter antages at være identiske i de<br />
forskellige strata — i modsætning til den epidemiologiske brug af<br />
udtrykket “stratificerede analyser”, som betyder helt separate<br />
analyser for hver værdi af stratifikationsvariablen!!<br />
Interaktion betyder, at effekten af en variabel, for eksempel bilirubin,<br />
afhænger af værdien af en anden variabel, for eksempel behandling,<br />
men effekterne ændres ikke med tiden.<br />
(Stratifikation og interaktion kan sagtens kombineres.)<br />
Ventetidsanalyse Specielle aspekter ved Cox modellen 30<br />
Forklarende variable i ventetidsanalyser: Stratifikationsvariable<br />
For stratifikationsvariable afhænger den underliggende rate af hvilken<br />
værdi, variablen har, dvs. forskellen p˚a individer med X = 1 og<br />
individer med X = 2 ændres med tiden:<br />
r(t; X = 1) = r1(t) og r(t; X = 2) = r2(t)<br />
Konsekvens:<br />
1. vi kan ikke beskrive effekten med et enkelt tal,<br />
2. stratifikationsvariable er nødt til at være kategoriske variable<br />
med et begrænset antal forskellige værdier.<br />
Ventetidsanalyse Transformation af regressionsvariable 32<br />
Behov for transformation af regressionsvariable<br />
• Kriterier og numeriske vurderinger er som i enhver anden<br />
statistisk model; men<br />
• grafiske vurderinger er mere kompliceret end for normalt fordelte<br />
outcomes
Ventetidsanalyse Transformation af regressionsvariable 33<br />
Behov for transformation af regressionsvariable<br />
Kriterier for valg af parametrisering/transformation<br />
• Biologisk/medicinsk begrundelse (bedst, men sjældent muligt).<br />
– Raten vokser eksponentielt med utransformerede kovariater,<br />
mens en logaritmetransformation af en kovariat betyder, at<br />
raten vokser med en fast faktor eller procentdel, hver gang<br />
kovariaten vokser med f.eks. 10%.<br />
• Transformationer brugt af andre (sammenlignelighed).<br />
• Den “bedst mulige” transformation for de aktuelle data — pas p˚a:<br />
signifikansen vil blive overvurderet, og man kan ikke g˚a ud fra, at<br />
den samme transformation er den mest optimale i andre data —<br />
men det kan være et fornuftigt kriterium for konfounderne.<br />
Ventetidsanalyse Transformation af regressionsvariable 35<br />
Transformation af serum bilirubin<br />
PROC UNIVARIATE DATA=skl PCTLDEF=3; * Tjek, om fordelingen er skæv;<br />
VAR bilirub;<br />
HISTOGRAM / HEIGHT=5;<br />
RUN;<br />
Ventetidsanalyse Transformation af regressionsvariable 34<br />
Behov for transformation af regressionsvariable<br />
Kriteria for valg af parametrisering/transformation fortsat<br />
• Se p˚a fordelingen af den forklarende variabel: Nogle f˚a ekstreme<br />
værdier af den forklarende variabel kan have urimeligt stor<br />
indflydelse p˚a konklusionerne, medmindre variablen transformeres<br />
nogle f˚a ekstremt høje → loga(x),<br />
nogle f˚a ekstremt lave → exp(x/c) (sjældent brugt)].<br />
Det bør altid tjekkes, om den valgte transformation “gør<br />
vold p˚a data”.<br />
Ved at vælge XX = log(x)/ log(1.1) som kovariat, f˚ar man, at exp( ˆ b)<br />
(Hazard Ratio) direkte estimerer den faktor, som raten skal ganges med<br />
for en 10% forskel i kovariaten.<br />
Ventetidsanalyse Transformation af regressionsvariable 36<br />
Transformation af serum bilirubin<br />
DATA skl; SET skl; log2Bilirub=LOG2(bilirub); RUN;<br />
PROC UNIVARIATE DATA=skl PCTLDEF=3;<br />
VAR log2Bilirub;<br />
HISTOGRAM / HEIGHT=5;<br />
RUN;
Ventetidsanalyse Transformation af regressionsvariable 37<br />
Behov for transformation af regressionsvariable<br />
• Simpelt, numerisk test: Inkluder b˚ade en utransformeret og<br />
en transformeret version af variablen samtidigt – f.eks. X og<br />
log2(X) – for at se, om der er et klart svar p˚a hvilken, der er den<br />
bedste prediktor. Kræver en fornuftigt valg af transformation –<br />
logaritmetransformation er ofte et oplagt valg, fordi det svarer til<br />
stabil effekt af relative forskelle, hvilket ofte er det intuitivt<br />
naturlige valg.<br />
• Mere kompliceret numerisk og grafisk test: Lineær spline<br />
(se eksempelvis Greenland 1995, Epidemiology, s. 356-365).<br />
Eksempel til selvstudium for de særligt eventyrlystne SAS-hajer<br />
sidst i disse noter (fra s. 80).<br />
Ventetidsanalyse Transformation af regressionsvariable 39<br />
Transformation af serum bilirubin<br />
Inklusion af serum bilirubin utransformeret s˚avel som<br />
logaritmetransformeret:<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) = sklero bilirub log2bilirub;<br />
RUN;<br />
-----------------------------------------------------<br />
Parameter Standard<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq<br />
Sklero 1 -0.18290 0.21596 0.7172 0.3971<br />
Bilirub 1 -0.0001959 0.00231 0.0072 0.9325<br />
log2Bilirub 1 0.48004 0.18152 6.9939 0.0082<br />
NB: De bilirubin-relaterede estimater kan ikke umiddelbart fortolkes<br />
(“ændring i raten, n˚ar bilirubin fordobles samtidigt med, at bilirubin<br />
holdes fast . . . ”).<br />
Hvis de begge er signifikante (og betydelige), og det ikke hjælper at tilføje andre<br />
forklarende variable, s˚a kan effekten bedst illustreres i en graf.<br />
Ventetidsanalyse Transformation af regressionsvariable 38<br />
Plot af sammenhængen med bilirubin som en lineær spline<br />
Ventetidsanalyse Transformation af regressionsvariable 40<br />
Estimation med log2(serum bilirubin)<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) = sklero log2bilirub / RISKLIMITS;<br />
RUN;<br />
---------------------------------------------------<br />
Parameter Standard<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq<br />
Sklero 1 -0.18373 0.21575 0.7252 0.3944<br />
log2Bilirub 1 0.46716 0.09706 23.1656
Ventetidsanalyse Opsummering 2. del 41<br />
Opsummering 2. del<br />
Standard valg af regressionsmodel:<br />
• Cox’s proportional hazards regressionsmodel<br />
Forskellige m˚ader variable kan indg˚a p˚a:<br />
• Via det prognostiske index<br />
– lineære variable<br />
– klassevariable<br />
– interaktion<br />
• Stratifikation<br />
Transformation af regressionsvariable:<br />
• Kriterier for valg af transformation<br />
• Simpelt numerisk test<br />
• Grafisk test er mere besværligt<br />
Ventetidsanalyse Særlig modelkontrol for Cox modellen 43<br />
Plot af log(kumuleret rate) for grafisk tjek af proportionalitet<br />
Ventetidsanalyse Særlig modelkontrol for Cox modellen 42<br />
Speciel modelkontrol i Cox modellen<br />
Cox modellen forudsætter proportionale rater,<br />
R(t; X) = R0(t) exp(bX), og dermed<br />
ln(R(t; X)) = ln(R0(t)) + bX<br />
Grafisk tjek af proportionale rater: Stratificer for hver variabel, en ad<br />
gangen, og plot<br />
ln(R stratum (t)) = ln( − ln(S stratum (t)) )<br />
som funktion af tiden. Kurverne skal være nogenlunde parallelle.<br />
Ventetidsanalyse Særlig modelkontrol for Cox modellen 44<br />
SAS kode til grafisk tjek af proportionale rater<br />
TITLE ’Graphical check of proportionality’;<br />
PROC PHREG DATA=skl NOPRINT;<br />
MODEL day*bld(0) = log2bilirub;<br />
STRATA sklero;<br />
BASELINE OUT=check LOGLOGS=LCumRate LOGSURV=CumRate<br />
/ METHOD=CH;<br />
RUN;<br />
PROC GPLOT DATA=check; WHERE 0
Ventetidsanalyse Særlig modelkontrol for Cox modellen 45<br />
Numerisk test af proportionalitet ved brug af tidsafhængige variable<br />
Vælg passende opdeling (her 14 og 105 dage), hvor rate ratioen tillades at<br />
være forskellig for de forskellige tidsintervaller. Dette gøres v.h.a. dummy<br />
variable (her SKLFRA14 og SKLFRA105). Proportionalitetsantagelsen testes<br />
ved at teste, om disse dummy-variable er signifikante:<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) = log2bilirub sklero SKLfra14 SKLfra105;<br />
IF sklero=1 AND day>=14 THEN SKLfra14=1; ELSE SKLfra14=0;<br />
IF sklero=1 AND day>=105 THEN SKLfra105=1; ELSE SKLfra105=0;<br />
TestProp: TEST SKLfra14, SKLfra105;<br />
RUN;<br />
For hvert reblødningstidspunkt beregnes variablene inden i PHREG for hver enkelt af de<br />
patienter, der er under risiko p˚a netop det tidspunkt (i’erne i nævneren p˚a s. 28). I<br />
beregningerne for hver enkelt patient i bruger SAS de værdier, som variablene (her<br />
sklero) har for den enkelte patient i, undtagen for tids-responsvariablen (her day),<br />
som er lig det aktuelle reblødningstidspunkt tj (reblødningstidspunktet for patient j<br />
p˚a s. 28)<br />
Ventetidsanalyse Tidsskalaer 47<br />
Virkelighedstjek!<br />
Tid fra stop af seneste blødning har stor betydning for<br />
sandsynligheden for at begynde at rebløde her og nu<br />
• dels er det ikke muligt at rebløde, mens den foreg˚aende blødning<br />
stadig er i gang,<br />
• dels mindskes sandsynligheden for at rebløde markant med, hvor<br />
længe det er siden, man blødte sidst.<br />
Vi har alts˚a to komplikationer:<br />
1. Patienterne er ikke under risiko fra tid 0 for at blive observeret<br />
med start p˚a en reblødning i vores studie.<br />
2. ’Tid’ er ikke bare tid – der er flere tidsskalaer at vælge imellem.<br />
Ventetidsanalyse Særlig modelkontrol for Cox modellen 46<br />
Del af output fra PROC PHREG<br />
Parameter Standard<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq<br />
log2Bilirub 1 0.45833 0.09654 22.5398 ChiSq<br />
TestProp 1.9445 2 0.3782<br />
Ventetidsanalyse Tidsskalaer 48<br />
Valg af tidsskala<br />
Hidtil har vi brugt tid siden randomisering som tid i Cox modellen –<br />
men reblødningsraten afhænger langt mere af, hvor længe siden det<br />
er, patienten holdt op med at bløde.<br />
• Fordelen ved Cox modellen er, at den tillader en vilk˚arlig<br />
sammenhæng mellem den underliggende rate og den valgte<br />
tidsskala.<br />
• Ratioen mellem raterne for to vilk˚arlige patienter i samme<br />
stratum p˚a et hvilket som helst tidspunkt afhænger kun af<br />
regressionsvariablene.<br />
• Egenskaber ved en relevant tidsskala: Der skal være en god grund<br />
til at tro, at raten ændres med tid siden tid 0 p˚a samme m˚ade for<br />
alle individer i samme stratum.
Ventetidsanalyse Tidsskalaer 49<br />
Eksempler p˚a tidsskalaer<br />
• alder<br />
• kalendertid<br />
Tidsskalaer<br />
• tid siden sygdommen begyndte<br />
• tid fra en eller anden hændelse af stor betydning for raten (her<br />
tid fra stop af foreg˚aende blødning)<br />
• tid fra randomisering (kan være problematisk)<br />
Den eneste forskel for det enkelte individ er definitionen af tid=0,<br />
men det kan gøre en væsentlig forskel, fordi det kan have stor<br />
betydning for hvem, der er “under risiko” i studiet, n˚ar den hændelse,<br />
der er i fokus, sker for et individ.<br />
Ventetidsanalyse Tidsskalaer 51<br />
Eksempler p˚a forskellige tidsskalaer ved reblødning<br />
Tid siden randomisering Tid siden slut p˚a første blødning:<br />
Ventetidsanalyse Tidsskalaer 50<br />
Forskellige tidsskalaer<br />
Kalendertid: Tid siden indgang i studiet:<br />
Ventetidsanalyse Tidsskalaer 52<br />
Valg af tidsskala<br />
Vælg den tidsskala, hvor raten varierer mest (eller mest ujævnt) med tiden<br />
inden for det tidsinterval, hvor man har observationer!<br />
Andre tidsskalaer kan indg˚a via regressionsvariable i Cox modellen og/eller<br />
via stratifikation. Hvis betydningen af en alternativ tidsskala ikke følger<br />
mønstret “en m˚aned mere betyder altid det samme”, s˚a er det nødvendigt<br />
enten at stratificere eller at bruge tidsafhængige regressionsvariable (se det<br />
numeriske test for proportionalitet s. 45 for et eksempel p˚a SAS<br />
programmering med tidsafhængige variable).
Ventetidsanalyse Tidsskalaer 53<br />
Forsinket indgang<br />
˚Arsag: Der skal ske et eller andet bestemt for individerne, før det ville<br />
tælle med i vores analyse, hvis de oplevede vores “outcome” hændelse.<br />
Dette sker p˚a forskellige tidspunkter for forskellige individer, og det er ikke<br />
altid sket før tid 0 i den valgte tidsskala.<br />
Eksempler:<br />
• for nogle patienter sker randomiseringen efter tid 0 i den valgte<br />
tidsskala<br />
• i analyser med tid siden randomisering kan patienterne ikke rebløde,<br />
før de er holdt op med den første blødning<br />
• nogen af de forklarende variable kræver en speciel undersøgelse, og<br />
nogen af patienterne er nødt til at vente p˚a denne undersøgelse<br />
• for at blive inkluderet skal personerne være i live og “raske” ved<br />
studiestart<br />
Ventetidsanalyse Konkurrerende afgangs˚arsager 55<br />
Virkelighedstjek 2!<br />
N˚ar vi overhovedet interesserer os for at mindske reblødningsraten, er<br />
det fordi reblødning er den væsentligste døds˚arsag blandt patienter,<br />
der en gang har blødt fra ˚areknuder i spiserøret.<br />
Men patienterne kan jo stadig dø, inden de n˚ar at rebløde!<br />
Ventetidsanalyse Tidsskalaer 54<br />
Forsinket indgang i SAS<br />
PROC PHREG DATA=skl;<br />
MODEL tNotBld*bld(0) = log2bilirub sklero<br />
/ ENTRY=t_entry RISKLIMITS;<br />
RUN;<br />
---------------------------------------------<br />
Model Information<br />
Data Set WORK.SKL<br />
Entry Time Variable t_entry<br />
Dependent Variable tNotBld<br />
Censoring Variable Bld<br />
Censoring Value(s) 0<br />
Ties Handling BRESLOW<br />
Percent<br />
Total Event Censored Censored<br />
149 86 63 42.28<br />
:<br />
Analysis of Maximum Likelihood Estimates<br />
Parameter Standard Hazard 95% Hazard Ratio<br />
Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits<br />
log2Bilirub 1 0.43431 0.09580 20.5534
Ventetidsanalyse Konkurrerende afgangs˚arsager 57<br />
Separate analyser af de to hændelser<br />
PROC PHREG DATA=skl;<br />
MODEL tNotBld*bld(0)=sklero log2bilirub ascites / ENTRY=t_entry RL;<br />
RUN;<br />
Parameter Standard Hazard 95% Hazard Ratio<br />
Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />
Sklero 1 -0.19124 0.22021 0.7542 0.3851 0.826 0.536 1.272<br />
log2Bilirub 1 0.42240 0.09677 19.0542 ChiSq Ratio Confidence Limits<br />
Sklero 1 0.17358 0.35173 0.2435 0.6217 1.190 0.597 2.370<br />
log2Bilirub 1 0.50353 0.14482 12.0890 0.0005 1.655 1.246 2.198<br />
Ascites 1 0.93763 0.38166 6.0354 0.0140 2.554 1.209 5.396<br />
Ventetidsanalyse Konkurrerende afgangs˚arsager 59<br />
Konkurrerende afgangs˚arsager<br />
Sandsynligheden for, at reblødningen sker efter præcis t dage, er lig<br />
med<br />
S(t; X) · r(t; X)<br />
hvor S(t; X) er sandsynligheden for at være i live til dag t uden at<br />
have reblødt inden da.<br />
Konsekvens:<br />
• Faktorer, som ikke p˚avirker raten for en bestemt slags hændelse,<br />
kan have en stærk effekt p˚a sandsynligheden for at opleve<br />
hændelsen via en effekt p˚a raten for en konkurrerende hændelse<br />
og dermed en effekt p˚a sandsynligheden for at være under risiko.<br />
• Effekten p˚a sandsynligheden for at opleve hændelsen kan i<br />
ekstreme tilfælde være modsat rettet effekten p˚a selve raten.<br />
Ventetidsanalyse Konkurrerende afgangs˚arsager 58<br />
Sandsynligheden for at være i live uden reblødning<br />
Hvis de forskellige hændelser kombineres, f˚as en vurdering af effekten<br />
af de forklarende variable p˚a tid til den første af disse hændelser sker:<br />
DATA skl; SET skl;<br />
status = bld + 2*dead;<br />
RUN;<br />
PROC PHREG DATA=skl;<br />
MODEL tNotBld*status(0) = sklero log2bilirub ascites / ENTRY=t_entry;<br />
RUN;<br />
--------------------------------------------------------------------<br />
Parameter Standard Hazard 95% Hazard Ratio<br />
Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />
Sklero 1 -0.08715 0.18555 0.2206 0.6386 0.917 0.637 1.319<br />
log2Bilirub 1 0.44557 0.08044 30.6819
Censurerede, normalt fordelte data 61<br />
Censurerede, normalt fordelte data<br />
Eksempel med SAS programbidder<br />
– til selvstudium –<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 63<br />
Eksempel p˚a venstrecensurerede data<br />
M˚alinger af NO2 indendørs og udendørs (Raaschou-Nielsen et al., 1997)<br />
Vi har 85 sæt af samhørende m˚al for NO2<br />
1. udenfor gadedøren<br />
2. i soveværelset<br />
med en detektionsgrænse p˚a 0.75.<br />
Vi ønsker at undersøge, hvor stor indflydelse udendørsniveauet har p˚a<br />
indendørsniveauet.<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 62<br />
Data med detektionsgrænse<br />
“Venstrecensurering”, dvs. man ved bare, at værdien er under en<br />
given grænse:<br />
Baggrundsstøj eller begrænsning i m˚aleudstyrets/assayets følsomhed<br />
har medført, at man ikke kan skelne mellem meget lave værdier.<br />
Man tør godt gøre antagelser om fordelingen af de sande m˚alinger,<br />
eksempelvis at residualerne er normalt fordelt (eventuelt efter<br />
logaritmetransformation af m˚alingerne).<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 64<br />
Eksempel p˚a venstrecensurerede data<br />
Samhørende m˚al for NO2 inde og ude<br />
(under detektionsgrænsen er plottet som lig med detektionsgrænsen)
Censurerede, normalt fordelte data (data med detektionsgrænse) 65<br />
Estimation af sammenhæng<br />
Hvad med bare at udelade de “ukendte”? Pas p˚a: Det er selektion<br />
baseret p˚a responsvariablen!<br />
DATA no2; SET no2;<br />
IF UPCASE(UnderDetekt)="JA" THEN inde=.;<br />
ude_25 = ude - 2.5; * Centrering af variabel ;<br />
RUN;<br />
PROC REG DATA=no2;<br />
Udensmaa: MODEL inde = ude_25;<br />
RUN;<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 67<br />
Fit uden data under detektionsgrænsen<br />
Samhørende m˚al for NO2 inde og ude<br />
Duer ikke p˚a grund af bias.<br />
Vi mangler alle de laveste indendørsværdier, s˚a linien ligger for højt<br />
for de lave udendørsværdier, og spredningen undervurderes!<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 66<br />
The REG Procedure<br />
Model: Udensmaa<br />
Dependent Variable: INDE<br />
Analysis of Variance<br />
Sum of Mean<br />
Source DF Squares Square F Value Pr>F<br />
Model 1 9.18865 9.18865 107.71 |t|<br />
Intercept 1 1.60065 0.03842 41.66
Censurerede, normalt fordelte data (data med detektionsgrænse) 69<br />
The REG Procedure<br />
Model: Naiv<br />
Dependent Variable: INDE<br />
Analysis of Variance<br />
Sum of Mean<br />
Source DF Squares Square F Value Pr>F<br />
Model 1 18.15521 18.15521 229.66 |t|<br />
Intercept 1 1.55732 0.03502 44.48
Censurerede, normalt fordelte data (data med detektionsgrænse) 73<br />
Fit med gæt p˚a gennemsnitsværdi<br />
Samhørende m˚al for NO2 inde og ude<br />
Vi ved ikke, om linien ligger for højt (for højt gæt p˚a gennemsnit)<br />
eller for lavt (for lavt gæt p˚a gennemsnit) for de lave<br />
udendørsværdier, men spredningen undervurderes stadig.<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 75<br />
I SAS skal der være to variable, der viser de faktiske nedre henholdsvis<br />
øvre grænser for responsvariablens værdi.<br />
• For observerede værdier er nedre og øvre grænse lig observationen.<br />
• For observationer under detektionsgrænsen er den nedre grænse<br />
ukendt, hvilket angives som et . (missing) i SAS, og den øvre grænse er<br />
lig med detektionsgrænsen.<br />
DATA no2; SET no2;<br />
IF UPCASE(UnderDetekt)="JA"<br />
THEN DO;<br />
nedre = .; oevre = 0.75;<br />
END;<br />
ELSE DO;<br />
nedre = inde; oevre = inde;<br />
END;<br />
RUN;<br />
PROC LIFEREG DATA=no2;<br />
MODEL (nedre, oevre) = ude_25 / DIST=NORMAL NOLOG;<br />
RUN;<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 74<br />
Korrekt estimation af sammenhæng<br />
Optimal udnyttelse af data opn˚as ved at inkludere præcis den viden,<br />
vi har:<br />
De censurerede data er mindre end detektionsgrænsen.<br />
Princip:<br />
• For hver af observationerne under detektionsgrænsen kan det<br />
udregnes, hvad sandsynligheden er for, at observationen ligger under<br />
detektionsgrænsen for givne værdier af alle modelparametrene, b˚ade<br />
regressionsparametrene og variansparameteren. Denne sandsynlighed<br />
indg˚ar i estimationen.<br />
• De “almindelige” observationer indg˚ar p˚a sædvanlig vis.<br />
Alle modelparametrene estimeres som de værdier, der alt i alt passer bedst<br />
med det observerede, inklusive at observationerne under detektionsgrænsen<br />
faktisk l˚a under denne grænse.<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 76<br />
The LIFEREG Procedure<br />
Model Information<br />
Data Set WORK.NO2<br />
Dependent Variable nedre<br />
Dependent Variable oevre<br />
Number of Observations 85<br />
Noncensored Values 60<br />
Right Censored Values 0<br />
Left Censored Values 25<br />
Interval Censored Values 0<br />
Name of Distribution Normal<br />
Log Likelihood -35.88065877<br />
Algorithm converged.<br />
Type III Analysis of Effects<br />
Wald<br />
Effect DF Chi-Square Pr > ChiSq<br />
ude_25 1 177.8626 ChiSq<br />
Intercept 1245.07
Censurerede, normalt fordelte data (data med detektionsgrænse) 77<br />
Optimalt fit<br />
Samhørende m˚al for NO2 inde og ude<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 79<br />
Sammenligning af resultater<br />
Oversigt over resultaterne af de 4 analyser:<br />
Ude_25<br />
Model Parameter Standard<br />
Estimate Error SD ("Root MSE")<br />
Udensmaa 0.600 0.058 0.292<br />
Naiv 0.643 0.042 0.281<br />
Adhoc 0.738 0.049 0.324<br />
Optimal 0.785 0.059 0.344<br />
Censurerede, normalt fordelte data (data med detektionsgrænse) 78<br />
Estimation af standard deviation<br />
scale = maximum likelihood estimat for standard deviationen (SD)<br />
(=residualspredning=prediktionsspredning). For at f˚a noget, der er<br />
sammenligneligt med det sædvanlige estimat (“ROOT MSE” i SAS<br />
output), skal der justeres:<br />
SD* = scale ·<br />
√ n<br />
n − k − 1<br />
(n = antal observationer, k = antal kovariater).<br />
√<br />
85<br />
Her f˚as SD*= 0.340 · 83 = 0.344.<br />
Lineære splines 80<br />
SAS kode til lineære splines<br />
– til selvstudium –
Lineære splines 81<br />
Konstruktion af en lineær spline<br />
(Pilene viser kvartilerne blandt reblødere)<br />
Lineære splines 83<br />
Beregning af percentiler blandt reblødere<br />
PROC UNIVARIATE DATA=skl PCTLDEF=3; WHERE bld=1;<br />
VAR bilirub;<br />
RUN;<br />
Quantile Estimate<br />
100% Max 495<br />
99% 495<br />
95% 177<br />
90% 146<br />
75% Q3 73<br />
50% Median 47<br />
25% Q1 26<br />
10% 15<br />
5% 12<br />
1% 4<br />
0% Min 4<br />
Lineære splines 82<br />
Lineær spline, princip:<br />
Vi konstruerer nogle variable, der tilsammen summerer til serum<br />
bilirubin-variablen eventuelt fratrukket et passende tal. Hver variabel<br />
fanger den del af variationen i serum bilirubin-værdierne, der ligger i et<br />
præ-defineret interval.<br />
Af hensyn til den statistiske styrke kan det anbefales at lægge intervallerne,<br />
s˚a der er ca. lige mange hændelser i hvert interval.<br />
Her er valgt 4 variable, der summerer til bilirubin−nedre kvartil.<br />
Interval-endepunkterne (engelsk “knots”) er placeret ved kvartilerne blandt<br />
rebløderne: 26, 47 og 73<br />
• b_u26 fanger variationen i bilirubin for værdier under 26<br />
• b_26_47 fanger variationen i bilirubin for værdier mellem 26 og 47<br />
• b_47_73 fanger variationen i bilirubin for værdier mellem 47 og 73<br />
• b_o73 fanger variationen i bilirubin for værdier over 73<br />
Lineære splines 84<br />
Mulig kode for de nødvendige ekstra variable i SAS<br />
DATA skl; SET skl;<br />
IF NOT MISSING(bilirub) AND bilirub
Lineære splines 85<br />
Kort “smart” SAS-kode, der gør det samme<br />
MIN finder den mindste værdi og MAX finder den største værdi af de<br />
variable eller tal, der st˚ar i parentesen<br />
(farverne p˚a variabelnavnene svarer til farverne p˚a liniestykkerne i figuren)<br />
Lineære splines 87<br />
Estimation og test af lineær spline<br />
(Kvartilerne blandt reblødere (26, 47, og 73) blev fundet v.h.a.<br />
PROC UNIVARIATE PCTLDEF=3; WHERE bld=1; VAR bilirub; RUN;)<br />
PROC PHREG DATA=skl;<br />
MODEL day*bld(0) =<br />
b_u26 b_26_47 b_47_73 b_o73 sklero<br />
/ RISKLIMITS;<br />
TestLine: TEST b_u26=b_26_47=b_47_73=b_o73;<br />
RUN;<br />
Lineære splines 86<br />
Plot af de kovariater, der indg˚ar i den “smarte” kode<br />
Lineære splines 88<br />
Estimation og test af lineær spline fortsat<br />
Parameter Standard Hazard 95% Hazard Ratio<br />
Variable DF Estimate Error Chi-Sq. Pr>ChiSq Ratio Confidence Limits<br />
b_u26 1 -0.01390 0.03276 0.1801 0.6712 0.986 0.925 1.052<br />
b_26_47 1 0.03250 0.02161 2.2618 0.1326 1.033 0.990 1.078<br />
b_47_73 1 0.03483 0.01412 6.0838 0.0136 1.035 1.007 1.065<br />
b_o73 1 0.00162 0.00161 1.0189 0.3128 1.002 0.998 1.005<br />
Sklero 1 -0.13197 0.21954 0.3613 0.5478 0.876 0.570 1.348<br />
Linear Hypotheses Testing Results<br />
Label Wald Chi-Square DF Pr > ChiSq<br />
TestLine 15.7811 3 0.0013<br />
“Parameter Estimate” er hældningen for ln(rate ratio) indenfor<br />
hvert af intervallerne. “Hazard Ratio” er derfor et m˚al for den<br />
interval-specifikke dosis-respons relation.
Lineære splines 89<br />
Plot af lineær spline: Datasæt, der skal plottes<br />
5 og 95 percentilerne for bilirubin blandt reblødere er 12 og 177<br />
DATA plot;<br />
DO bili=12, 26, 47, 73, 177; * Knækpunkter og endepunkter;<br />
* Variabelværdier svarende til knæk- og endepunkter beregnes ;<br />
b_u26=MIN(bili-26,0);<br />
b_o26=MAX(bili-26,0);<br />
b_o47=MAX(bili-47,0);<br />
b_26_47=b_o26-b_o47;<br />
b_o73=MAX(bili-73,0);<br />
b_47_73=b_o47-b_o73;<br />
* Parameterestimaterne fra outputtet ganges p˚a de tilsvarende variable ;<br />
* for at udregne den prædikterede værdi af det Prognostiske Index ;<br />
* (eksponenten i Cox modellen) ;<br />
pi = -0.01390*b_u26 +0.03250*b_26_47<br />
+0.03483*b_47_73 +0.00162*b_o73;<br />
rr = EXP(pi); * PI omregnes til Rate Ratio ;<br />
OUTPUT;<br />
END;<br />
RUN;<br />
Lineære splines 90<br />
Plot af lineær spline<br />
Eksempel p˚a et kald af PROC GPLOT med SYMBOL og AXIS statements:<br />
SYMBOL1 C=BLACK V=CIRCLE I=JOIN L=1;<br />
AXIS1 LABEL=(F=CENTX ’Bilirubin’) ;<br />
AXIS2 LABEL=(F=CENTX A=90 R=0 ’Rate ratio’)<br />
LOGBASE=2 INTERVAL=UNEVEN;<br />
PROC GPLOT DATA=plot;<br />
PLOT rr*bili / HAXIS=AXIS1 VAXIS=AXIS2;<br />
RUN;