现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
5.22 棘状图 115<br />
离散化处理,然后在离散的区间内计算因变量的条件分布。除此之外,棘<br />
状图还兼顾了自变量的分布,在横轴方向上以不同宽度的矩形表示自变<br />
量的分布密度。 因此,从纵轴方向上看,棘状图用堆砌的矩形块表示因<br />
变量的分布密度,这使得它看起来像堆砌的条形图,而从横轴方向上看,<br />
棘状图用不同的矩形宽度表示自变量的密度分布,这使得它又像是马赛<br />
克图(马赛克图中矩形的长宽和频数成比例)。 尤其是自变量为分类变量<br />
时,棘状图与马赛克图几乎无异。从概念和定义上来讲,棘状图实际上是<br />
用P (Y |X)对P (X)所作的图。<br />
R中棘状图的函数为spineplot(),其用法如下:<br />
1 > usage(spineplot, "default", 0.75)<br />
spineplot(x, y = NULL, breaks = NULL,<br />
tol.ylab = 0.05, off = NULL, ylevels = NULL,<br />
col = NULL, main = "", xlab = NULL, ylab = NULL,<br />
xaxlabels = NULL, yaxlabels = NULL, xlim = NULL,<br />
ylim = c(0, 1), axes = TRUE, ...)<br />
1 > usage(spineplot, "formula")<br />
spineplot(formula, data = list(), breaks = NULL,<br />
tol.ylab = 0.05, off = NULL, ylevels = NULL, col = NULL,<br />
main = "", xlab = NULL, ylab = NULL, xaxlabels = NULL,<br />
yaxlabels = NULL, xlim = NULL, ylim = c(0, 1),<br />
axes = TRUE, ..., subset = NULL)<br />
棘状图函数是泛型函数,可以直接接受数据或者公式作为参数。x可以<br />
是一个分类或数值向量(自变量),也可以直接输入一个列联表,后一种情<br />
况下则不需要再输入y参数;y为因变量,是一个分类变量;breaks在自变量<br />
是连续变量时给定自变量的分段区间或者分段方法,这个参数最终被传递<br />
给直方图函数hist()(回顾5.1小节)以便计算自变量的密度;off参数指定矩<br />
形竖条之间的间距,对于连续自变量来说,off默认为0,对于离散自变量,<br />
off默认为2;col用来设定不同类别的y的颜色。<br />
图5.29重新使用航天飞机O型环失效数据作了棘状图。我们可以看到,<br />
自变量温度被分为了7个长度为5的区间,每个区间内失效的比率都用堆砌<br />
的矩形表达。注意棘状图的横坐标轴比较特殊,它对自变量的值来说并不<br />
一定是均匀的,因为图中矩形的宽需要表达自变量的密度,所以横坐标的<br />
作用仅仅是作为密度值大小的参照物。棘状图会返回一个汇总表,表中给<br />
出了自变量的分段情况以及相应的频数。 读者可以结合频数表理解棘状<br />
图。