02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5.7 条件密度图 77<br />

R中关联图的函数为assocplot(),用法如下:<br />

1 > usage(assocplot)<br />

assocplot(x, col = c("black", "red"), space = 0.3,<br />

main = NULL, xlab = NULL, ylab = NULL)<br />

其中x为一个列联表数据(或者矩阵);col为朝上和朝下矩形的颜色;<br />

space用来设置矩形之间的间距。<br />

图5.9是关于HairEyeColor数据的关联图。原始数据为一个三维数组,<br />

首先我们在性别维度上将数据汇总,得到眼睛颜色(棕蓝褐绿)和头发颜<br />

色(黑棕红金)人数的列联表。我们关心的问题是头发颜色与眼睛颜色之<br />

间是否存在关联,当然我们可以马上用函数chisq.test()作检验,但是检验的<br />

结果非常单一,我们只能知道零假设(独立)可否被拒绝,而图5.9则细致<br />

展示了数据的内部信息,例如从图中我们可以清楚看到,并非所有单元格<br />

都与期望频数有很大差异,只是少数几个单元格贡献了较大的χ 2 值,如金<br />

发碧眼、金发棕眼等;事实上,这批数据为调查数据,眼睛颜色和头发颜<br />

色都为受访者(Delaware大学的592名学生)自己填写,我们观察到金发<br />

碧眼单元格的期望频数和实际频数差异甚大,据说这背后有一则有趣的故<br />

事:由于“金发碧眼”是大家公认的美的标准,因此有些学生在填问卷时<br />

故意偏向于填写“金发碧眼”,导致“金发碧眼”的实际频数严重偏高 1 。<br />

从图5.9的代码输出中我们知道,χ 2 检验可以拒绝零假设,眼睛的颜色与头<br />

发的颜色并不独立,二者之间存在某种关联关系,然而这种关联关系是由<br />

于生物或遗传原因引起还是受访者有意隐瞒自己的信息,则需要我们进一<br />

步斟酌了。<br />

在vcd包(Meyer et al., 2010)中有一个类似的关联图函数assoc(),但功能<br />

比本节中介绍的函数要更强大,详细介绍参见Meyer et al. (2006); Zeileis et<br />

al. (2007)。<br />

5.7 条件密度图<br />

条件密度图(Conditional Density Plot),顾名思义,展示的是一个变<br />

量的条件密度,确切的说是一个分类变量Y 相对一个连续变量X的条件密<br />

度P (Y |X)。假设Y 的取值为1, 2, · · · , k,那么条件密度图将按照X的取值从<br />

1 本书作者在爱荷华州立大学统计系读博士期间,每周统计图形小组有一次讨论,这则消息来自于作者<br />

的一位导师Heike Hofmann教授

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!