现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
5.22 棘状图 113<br />
可将图5.28放大8倍,就立刻理解“网格”的意思了。<br />
R中平滑散点图的函数为smoothScatter(),其用法如下:<br />
1 > usage(smoothScatter)<br />
smoothScatter(x, y = NULL, nbin = 128, bandwidth,<br />
colramp = colorRampPalette(c("white", blues9)),<br />
nrpoints = 100, pch = ".", cex = 1, col = "black",<br />
transformation = function(x) x^0.25, postPlotHook = box,<br />
xlab = NULL, ylab = NULL, xlim, ylim, xaxs = par("xaxs"),<br />
yaxs = par("yaxs"), ...)<br />
其中x和y是两个数值向量,或者如果不提供y的话,可以提供一个两列<br />
的矩阵/数据框等给x;nbin为横纵坐标方向上划分网格的数目,可以是长度<br />
为1或2的整数向量;bandwidth为计算核密度估计时使用的带宽;colramp为<br />
生成颜色向量的函数,默认生成从白色到蓝色渐变的颜色向量;nrpoints为<br />
需要画出来的点的数目,因为平滑散点图的目的不是画散点,而是画颜<br />
色块,但有时候图形中某些地方的密度估计非常低,因此对应颜色也非常<br />
浅,导致读者难以察觉那些地方还有数据点的存在,此时不妨直接将这些<br />
“离群点”直接画出来,注意画点时按密度值从小到大的顺序画,一直画到<br />
第nrpoints个点;其它参数几乎都是画图的一般参数,此处不再介绍。<br />
图5.28是MSG包中BinormCircle数据的平滑散点图,其原始散点图参<br />
见图5.8左图。由于使用了核密度估计,这批数据中藏着的圆圈很容易就能<br />
被发现,因为它们的密度值都很大,导致这一圈上颜色也就相应较深。平<br />
滑散点图看起来和图5.8右图比较相似,但前者蕴含了更多的数理统计背景。<br />
不过,我们也不必一味追求数学理论,“透明色可叠加”这一点性质体现出<br />
的原理又何尝不是一种“密度估计”呢?<br />
5.22 棘状图<br />
棘状图(Spine Plot/Spinogram 3 )可以看作是马赛克图(5.16小节)<br />
的特例,也可以看作是堆砌条形图(5.4小节)的推广。棘状图的外观看起<br />
来像是高低不齐的荆棘丛,因此而得名。<br />
棘状图的原理和条件密度图非常类似,都展示了在给定某个自变量<br />
的情况下因变量的概率分布,但是棘状图首先对连续型的自变量进行了<br />
3 对于连续的自变量则称为Spine Plot,离散自变量则为Spinogram,这个单词是仿照Histogram而造。