02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.32 分类与回归树图 133<br />

1 > survdiff(Surv(time, status) ~ x, data = aml)<br />

Call:<br />

survdiff(formula = Surv(time, status) ~ x, data = aml)<br />

N Observed Expected (O-E)^2/E (O-E)^2/V<br />

x=Maintained 11 7 10.69 1.27 3.40<br />

x=Nonmaintained 12 11 7.31 1.86 3.40<br />

Chisq= 3.4 on 1 degrees of freedom, p= 0.0653<br />

根据3.2小节和图3.4的讲解,读者不难发现,生存函数图实际上就是在<br />

生存函数估计值的基础上使用阶梯状参数type = ’s’制成的线图。<br />

5.32 分类与回归树图<br />

分类与回归树(Classification and Regression Tree,CART)是一种递<br />

归分割(Recursive Partition)技术,它的目的是寻找自变量的某种分割,<br />

使得样本分割之后因变量各组之间的差异最大。这种分割会一直递归进行<br />

下去,直到满足停止条件。详细理论请参见Breiman et al. (1984)。<br />

rpart包(Therneau and Atkinson, 2010)提供了分类与回归树的计算拟<br />

合函数rpart(),该函数包同时也扩充了泛型函数plot(),凡是rpart类型的对<br />

象在作图时都会自动调用plot.rpart()生成树图。plot.rpart()的用法如下:<br />

1 > library(rpart)<br />

2 > usage(plot, "rpart")<br />

plot(x, uniform = FALSE, branch = 1, compress = FALSE,<br />

nspace, margin = 0, minbranch = 0.3, ...)<br />

x是一个rpart类型的对象,一般由rpart()函数拟合产生;uniform决定是<br />

否在从上至下的枝节点之间使用相等的纵向距离以避免树枝在某些局部<br />

区域靠得太近使图形难以辨认,默认情况下每两个枝节点之间的距离与<br />

拟合误差成比例;branch设定树枝的形状,0为“V”字型,1为垂直的形<br />

状,该参数可以取[0, 1]之间的数值以使得数值形状更像“V”’或更垂直;<br />

compress设定是否在横向上压缩树枝的间距使得图形更紧凑。<br />

我们利用rpart包中的一个脊椎矫正手术数据kyphosis来作一棵简单<br />

的分类树如图5.38。该数据包含一个因变量Kyphosis(术后是否还存在脊

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!