现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
130 第五章 图库<br />
1 > # 真实的分位数<br />
2 > qnorm(seq(0.1, 0.9, 0.2))<br />
[1] -1.2816 -0.5244 0.0000 0.5244 1.2816<br />
以上数据的5个分位数和理论分位数都比较接近,读者可以模拟其它分<br />
布,例如从卡方分布中生成随机数,看其分位数是多少,与正态分布分位<br />
数差异如何。<br />
R中QQ图的函数为qqplot(),由于正态分布是我们经常检验的分布,<br />
R也直接提供了一个画正态分布QQ图的函数qqnorm(),这两个函数都在基<br />
础包stats包中,它们的用法如下:<br />
1 > usage(qqplot)<br />
qqplot(x, y, plot.it = TRUE, xlab = deparse(substitute(x)),<br />
ylab = deparse(substitute(y)), ...)<br />
1 > usage(qqnorm, "default")<br />
qqnorm(y, ylim, main = "Normal Q-Q Plot",<br />
xlab = "Theoretical Quantiles", ylab = "Sample Quantiles",<br />
plot.it = TRUE, datax = FALSE, ...)<br />
1 > usage(qqline)<br />
qqline(y, datax = FALSE, ...)<br />
由于qqplot()检验的是两批数据的分布是否相同,所以它需要两个数据<br />
参数x和y,qqnorm()只需要一个数据参数x,其它设置标签和标题等元素的<br />
图形参数此处不再赘述。<br />
图5.36左图是喷泉间隔时间数据的正态分布QQ图(5.1小节的直方图用<br />
到过),注意其中的数据经过了标准化,使之均值为0,方差为1。可以看出,<br />
数据点并不呈直线分布,这说明(标准化后的)数据的分布和标准正态分<br />
布有所差异,那么具体是何种差异呢?图的左边有一部分点偏离在直线上<br />
方,说明实际分位数大于理论分位数,从密度曲线的角度来说,也就是实<br />
际数据的分布曲线更偏右一些,理论分布曲线左边的尾巴向左伸得更远,<br />
而图的右边又有一些点在直线下方,说明此处实际分布曲线偏左,即实际<br />
分位数偏小。右图画出了数据的核密度估计曲线(实线)和真正的标准正<br />
态分布密度曲线(虚线),读者可以将二者的对比结合左图来理解QQ图中<br />
数据点偏离直线的方向与分布曲线的偏向关系。