02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.7 条件密度图 79<br />

小到大在纵轴方向上依次展示出Y = i (i = 1, 2, · · · , k)的条件概率分布比<br />

例Pi = P (Y = i|X = x),这些比例大小沿横轴方向上以多边形表示,在任<br />

一一个X点,所有比例之和均为1,这个性质是显而易见的:<br />

k<br />

P (Y = i|X = x) = 1; ∀x<br />

i=1<br />

R中条件密度图的函数为cdplot(),它主要是基于密度函数density()完成<br />

条件密度的计算(Hofmann and Theus, 2005),其用法如下:<br />

1 > usage(cdplot, "default")<br />

cdplot(x, y, plot = TRUE, tol.ylab = 0.05,<br />

ylevels = NULL, bw = "nrd0", n = 512, from = NULL,<br />

to = NULL, col = NULL, border = 1, main = "", xlab = NULL,<br />

ylab = NULL, yaxlabels = NULL, xlim = NULL, ylim = c(0,<br />

1), ...)<br />

1 > usage(cdplot, "formula")<br />

cdplot(formula, data = list(), plot = TRUE,<br />

tol.ylab = 0.05, ylevels = NULL, bw = "nrd0", n = 512,<br />

from = NULL, to = NULL, col = NULL, border = 1,<br />

main = "", xlab = NULL, ylab = NULL, yaxlabels = NULL,<br />

xlim = NULL, ylim = c(0, 1), ..., subset = NULL)<br />

函数cdplot()是泛型函数,它可以支持两种参数类型:直接输入两个数<br />

值向量x和y或者一个公式y~x。x为条件变量X,它是一个数值向量,y是一<br />

个因子向量,即离散变量Y ;plot为逻辑值,决定了是否作出图形(或者仅<br />

仅是计算而不作图);ylevels给出因子的取值水平(或者分类的名称),bw、<br />

n、from和to都将被传递给density()函数以计算密度值,请参考density()帮助<br />

文件;col给定一个颜色向量用以代表Y 的各种取值(默认为不同深浅的灰<br />

色);border为多边形的边线颜色;其它参数诸如标题、坐标轴范围等此处<br />

略去。<br />

这里我们以美国国家航空和宇宙航行局的一批O型环(O-ring,一种由<br />

橡胶或塑料制成的平环,用作垫圈)失效数据为例,这批数据有两个变量:<br />

温度变量和是否失效的变量。为了探索温度对O型环失效的影响,我们可以<br />

使用诸如Logistic回归之类的统计模型去计算、分析,而这里我们用条件密<br />

度图来展示温度的影响,如图5.10。由于因变量是一个二分类变量,图中相<br />

应有两个多边形(带颜色的区域)分别表示是否失效,从图中我们可以清

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!