02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5.22 棘状图 113<br />

可将图5.28放大8倍,就立刻理解“网格”的意思了。<br />

R中平滑散点图的函数为smoothScatter(),其用法如下:<br />

1 > usage(smoothScatter)<br />

smoothScatter(x, y = NULL, nbin = 128, bandwidth,<br />

colramp = colorRampPalette(c("white", blues9)),<br />

nrpoints = 100, pch = ".", cex = 1, col = "black",<br />

transformation = function(x) x^0.25, postPlotHook = box,<br />

xlab = NULL, ylab = NULL, xlim, ylim, xaxs = par("xaxs"),<br />

yaxs = par("yaxs"), ...)<br />

其中x和y是两个数值向量,或者如果不提供y的话,可以提供一个两列<br />

的矩阵/数据框等给x;nbin为横纵坐标方向上划分网格的数目,可以是长度<br />

为1或2的整数向量;bandwidth为计算核密度估计时使用的带宽;colramp为<br />

生成颜色向量的函数,默认生成从白色到蓝色渐变的颜色向量;nrpoints为<br />

需要画出来的点的数目,因为平滑散点图的目的不是画散点,而是画颜<br />

色块,但有时候图形中某些地方的密度估计非常低,因此对应颜色也非常<br />

浅,导致读者难以察觉那些地方还有数据点的存在,此时不妨直接将这些<br />

“离群点”直接画出来,注意画点时按密度值从小到大的顺序画,一直画到<br />

第nrpoints个点;其它参数几乎都是画图的一般参数,此处不再介绍。<br />

图5.28是MSG包中BinormCircle数据的平滑散点图,其原始散点图参<br />

见图5.8左图。由于使用了核密度估计,这批数据中藏着的圆圈很容易就能<br />

被发现,因为它们的密度值都很大,导致这一圈上颜色也就相应较深。平<br />

滑散点图看起来和图5.8右图比较相似,但前者蕴含了更多的数理统计背景。<br />

不过,我们也不必一味追求数学理论,“透明色可叠加”这一点性质体现出<br />

的原理又何尝不是一种“密度估计”呢?<br />

5.22 棘状图<br />

棘状图(Spine Plot/Spinogram 3 )可以看作是马赛克图(5.16小节)<br />

的特例,也可以看作是堆砌条形图(5.4小节)的推广。棘状图的外观看起<br />

来像是高低不齐的荆棘丛,因此而得名。<br />

棘状图的原理和条件密度图非常类似,都展示了在给定某个自变量<br />

的情况下因变量的概率分布,但是棘状图首先对连续型的自变量进行了<br />

3 对于连续的自变量则称为Spine Plot,离散自变量则为Spinogram,这个单词是仿照Histogram而造。

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!