02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.22 棘状图 115<br />

离散化处理,然后在离散的区间内计算因变量的条件分布。除此之外,棘<br />

状图还兼顾了自变量的分布,在横轴方向上以不同宽度的矩形表示自变<br />

量的分布密度。 因此,从纵轴方向上看,棘状图用堆砌的矩形块表示因<br />

变量的分布密度,这使得它看起来像堆砌的条形图,而从横轴方向上看,<br />

棘状图用不同的矩形宽度表示自变量的密度分布,这使得它又像是马赛<br />

克图(马赛克图中矩形的长宽和频数成比例)。 尤其是自变量为分类变量<br />

时,棘状图与马赛克图几乎无异。从概念和定义上来讲,棘状图实际上是<br />

用P (Y |X)对P (X)所作的图。<br />

R中棘状图的函数为spineplot(),其用法如下:<br />

1 > usage(spineplot, "default", 0.75)<br />

spineplot(x, y = NULL, breaks = NULL,<br />

tol.ylab = 0.05, off = NULL, ylevels = NULL,<br />

col = NULL, main = "", xlab = NULL, ylab = NULL,<br />

xaxlabels = NULL, yaxlabels = NULL, xlim = NULL,<br />

ylim = c(0, 1), axes = TRUE, ...)<br />

1 > usage(spineplot, "formula")<br />

spineplot(formula, data = list(), breaks = NULL,<br />

tol.ylab = 0.05, off = NULL, ylevels = NULL, col = NULL,<br />

main = "", xlab = NULL, ylab = NULL, xaxlabels = NULL,<br />

yaxlabels = NULL, xlim = NULL, ylim = c(0, 1),<br />

axes = TRUE, ..., subset = NULL)<br />

棘状图函数是泛型函数,可以直接接受数据或者公式作为参数。x可以<br />

是一个分类或数值向量(自变量),也可以直接输入一个列联表,后一种情<br />

况下则不需要再输入y参数;y为因变量,是一个分类变量;breaks在自变量<br />

是连续变量时给定自变量的分段区间或者分段方法,这个参数最终被传递<br />

给直方图函数hist()(回顾5.1小节)以便计算自变量的密度;off参数指定矩<br />

形竖条之间的间距,对于连续自变量来说,off默认为0,对于离散自变量,<br />

off默认为2;col用来设定不同类别的y的颜色。<br />

图5.29重新使用航天飞机O型环失效数据作了棘状图。我们可以看到,<br />

自变量温度被分为了7个长度为5的区间,每个区间内失效的比率都用堆砌<br />

的矩形表达。注意棘状图的横坐标轴比较特殊,它对自变量的值来说并不<br />

一定是均匀的,因为图中矩形的宽需要表达自变量的密度,所以横坐标的<br />

作用仅仅是作为密度值大小的参照物。棘状图会返回一个汇总表,表中给<br />

出了自变量的分段情况以及相应的频数。 读者可以结合频数表理解棘状<br />

图。

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!