02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

130 第五章 图库<br />

1 > # 真实的分位数<br />

2 > qnorm(seq(0.1, 0.9, 0.2))<br />

[1] -1.2816 -0.5244 0.0000 0.5244 1.2816<br />

以上数据的5个分位数和理论分位数都比较接近,读者可以模拟其它分<br />

布,例如从卡方分布中生成随机数,看其分位数是多少,与正态分布分位<br />

数差异如何。<br />

R中QQ图的函数为qqplot(),由于正态分布是我们经常检验的分布,<br />

R也直接提供了一个画正态分布QQ图的函数qqnorm(),这两个函数都在基<br />

础包stats包中,它们的用法如下:<br />

1 > usage(qqplot)<br />

qqplot(x, y, plot.it = TRUE, xlab = deparse(substitute(x)),<br />

ylab = deparse(substitute(y)), ...)<br />

1 > usage(qqnorm, "default")<br />

qqnorm(y, ylim, main = "Normal Q-Q Plot",<br />

xlab = "Theoretical Quantiles", ylab = "Sample Quantiles",<br />

plot.it = TRUE, datax = FALSE, ...)<br />

1 > usage(qqline)<br />

qqline(y, datax = FALSE, ...)<br />

由于qqplot()检验的是两批数据的分布是否相同,所以它需要两个数据<br />

参数x和y,qqnorm()只需要一个数据参数x,其它设置标签和标题等元素的<br />

图形参数此处不再赘述。<br />

图5.36左图是喷泉间隔时间数据的正态分布QQ图(5.1小节的直方图用<br />

到过),注意其中的数据经过了标准化,使之均值为0,方差为1。可以看出,<br />

数据点并不呈直线分布,这说明(标准化后的)数据的分布和标准正态分<br />

布有所差异,那么具体是何种差异呢?图的左边有一部分点偏离在直线上<br />

方,说明实际分位数大于理论分位数,从密度曲线的角度来说,也就是实<br />

际数据的分布曲线更偏右一些,理论分布曲线左边的尾巴向左伸得更远,<br />

而图的右边又有一些点在直线下方,说明此处实际分布曲线偏左,即实际<br />

分位数偏小。右图画出了数据的核密度估计曲线(实线)和真正的标准正<br />

态分布密度曲线(虚线),读者可以将二者的对比结合左图来理解QQ图中<br />

数据点偏离直线的方向与分布曲线的偏向关系。

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!