现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
5.7 条件密度图 79<br />
小到大在纵轴方向上依次展示出Y = i (i = 1, 2, · · · , k)的条件概率分布比<br />
例Pi = P (Y = i|X = x),这些比例大小沿横轴方向上以多边形表示,在任<br />
一一个X点,所有比例之和均为1,这个性质是显而易见的:<br />
k<br />
P (Y = i|X = x) = 1; ∀x<br />
i=1<br />
R中条件密度图的函数为cdplot(),它主要是基于密度函数density()完成<br />
条件密度的计算(Hofmann and Theus, 2005),其用法如下:<br />
1 > usage(cdplot, "default")<br />
cdplot(x, y, plot = TRUE, tol.ylab = 0.05,<br />
ylevels = NULL, bw = "nrd0", n = 512, from = NULL,<br />
to = NULL, col = NULL, border = 1, main = "", xlab = NULL,<br />
ylab = NULL, yaxlabels = NULL, xlim = NULL, ylim = c(0,<br />
1), ...)<br />
1 > usage(cdplot, "formula")<br />
cdplot(formula, data = list(), plot = TRUE,<br />
tol.ylab = 0.05, ylevels = NULL, bw = "nrd0", n = 512,<br />
from = NULL, to = NULL, col = NULL, border = 1,<br />
main = "", xlab = NULL, ylab = NULL, yaxlabels = NULL,<br />
xlim = NULL, ylim = c(0, 1), ..., subset = NULL)<br />
函数cdplot()是泛型函数,它可以支持两种参数类型:直接输入两个数<br />
值向量x和y或者一个公式y~x。x为条件变量X,它是一个数值向量,y是一<br />
个因子向量,即离散变量Y ;plot为逻辑值,决定了是否作出图形(或者仅<br />
仅是计算而不作图);ylevels给出因子的取值水平(或者分类的名称),bw、<br />
n、from和to都将被传递给density()函数以计算密度值,请参考density()帮助<br />
文件;col给定一个颜色向量用以代表Y 的各种取值(默认为不同深浅的灰<br />
色);border为多边形的边线颜色;其它参数诸如标题、坐标轴范围等此处<br />
略去。<br />
这里我们以美国国家航空和宇宙航行局的一批O型环(O-ring,一种由<br />
橡胶或塑料制成的平环,用作垫圈)失效数据为例,这批数据有两个变量:<br />
温度变量和是否失效的变量。为了探索温度对O型环失效的影响,我们可以<br />
使用诸如Logistic回归之类的统计模型去计算、分析,而这里我们用条件密<br />
度图来展示温度的影响,如图5.10。由于因变量是一个二分类变量,图中相<br />
应有两个多边形(带颜色的区域)分别表示是否失效,从图中我们可以清