02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

132 第五章 图库<br />

信用风险发生时间。 这类数据一般统称为生存数据(survival data),而<br />

生存数据通常有一个明显特征就是删失。 关于生存分析的详细理论请参<br />

考Therneau and Grambsch (2000)等。<br />

本节要介绍的图形对象主要是生存函数(Survival Function),其定义<br />

是个体存活超过时间t的概率:<br />

S(t) = P (T > t); t ≥ 0<br />

对于存在删失的生存数据(ti, δi), i = 1, · · · , n(其中ti为记录时间,<br />

δi = 0表示存在删失,1表示个体没有删失),生存函数的Kaplan-Meier估<br />

计(Kaplan and Meier, 1958)为:<br />

⎧ <br />

n−i<br />

⎪⎨ i: t (<br />

(i)≤t n−i+1<br />

ˆS(t) =<br />

⎪⎩<br />

)δ (i), 对t ≤ t(n);<br />

<br />

0 如果δ(n) = 1,<br />

对t > t(n).<br />

未定义 如果δ(n) = 0,<br />

survival包(Therneau, 2009)提供了生存函数的计算和估计方法。具体<br />

函数为survfit(),它返回一个survfit类的对象,而survival包扩展了泛型函<br />

数plot(),使其拥有子函数plot.survfit(),因此在估计完生存函数之后,我们<br />

可以直接调用plot()生成生存函数图。函数plot.survfit()的用法如下:<br />

1 > library(survival)<br />

2 > usage(plot, "survfit")<br />

plot(x, conf.int, mark.time = TRUE, mark = 3,<br />

col = 1, lty = 1, lwd = 1, cex = 1, log = FALSE,<br />

xscale = 1, yscale = 1, firstx = 0, firsty = 1,<br />

xmax, ymin = 0, fun, xlab = "", ylab = "", xaxs = "S",<br />

...)<br />

其中x为一个survfit类的对象,通常由survfit()返回;conf.int决定是否在<br />

生存曲线上下作置信区间曲线(当图中只有一条生存曲线时默认会作置信<br />

区间);mark.time决定是否用短竖线标记出删失的时刻,或者直接指定一个<br />

时间向量以标记删失时刻;mark给出删失标记的样式,即:标记点的类型<br />

(参见图4.3)。<br />

图5.37展示了急性髓细胞白血病(Acute Myelogenous Leukemia)数<br />

据aml的生存函数图,该数据有一个分组变量x表示病人是否接受了化疗,<br />

从图中可以看出,接受化疗的病人生存函数的下降速度比没接受化疗的病<br />

人要慢,表明化疗还是有一定作用的。进一步我们可以用对数秩检验知道<br />

这两组病人的生存时间在10%的显著水平下有显著差异:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!