02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

124 第五章 图库<br />

stars 星形:一个矩阵,列数≥ 3,类似雷达图,给定从星星中心向每个方<br />

向的射线的长度(严格说是线段),最终这些射线的端点会连接起来<br />

形成一个星形,但射线本身不会被画出来;缺失值将被视作0(星形<br />

在符号图中并不直观,推荐直接使用星状图,见5.30小节)<br />

thermometers 温度计:一个矩阵,列数为3或4,前两列分别给定温度计的<br />

宽和高;若矩阵为三列,那么第三列为温度计内的“温度”高度,注<br />

意这一列的值应该小于1,否则温度的填充会超过温度计的范围;若<br />

矩阵为四列,那么温度将按照第三列与第四列的比率进行填充,同样,<br />

这两列的比率需要小于1<br />

boxplots 箱线图:一个矩阵,列数为5,前两列分别给定箱子的宽和高,第<br />

三、四列分别给定两条线(下线和上线)的长度,第五列与温度计类<br />

似,给定箱线图内的中位数标记线在箱子内部的高度比例,因此这一<br />

列数据也需要在[0, 1]范围内;这里只是借用了箱线图的称谓,符号图<br />

中的箱线与真正的箱线图之间没有关系<br />

不难看出,这六种符号图能展示的数据维度分别为3、3、4、≥ 5、5或6、<br />

7;参数inches为逻辑值,控制着符号的大小,若为TRUE(默认),那么图<br />

中所有符号的最长长度(边长或半径等等)将被设置为1英寸(约2.54厘<br />

米),其它长度按比例缩放,若该参数取一个正数,那么类似地,所有<br />

符号的最长长度的英寸值为该正数,因此TRUE和1的效果是相同的,如<br />

果inches为FALSE那么符号的长度单位取相应坐标轴的单位,例如符号中<br />

的1长度即为坐标轴上的1单位;add为逻辑值,设定是否将符号图添加到现<br />

有图形上;fg为符号的前景色;bg为符号的背景色或填充色;其它参数用<br />

来添加标题、设定坐标轴范围等。<br />

图5.33给出了六种基本符号的形状,注意观察各种符号是如何利用<br />

自己的特征将高维数据表达出来的。 下面我们通过实际数据来看符号图<br />

在展示数据时的效果,以2005年中国31省市自治区的人口特征数据为例,<br />

我们选取了人口自然增长率、 年底人口总数、 城镇人口比重、 人口预期<br />

寿命和高学历人数五个变量作为国民素质的刻画指标,数据见MSG包中<br />

的ChinaPop.R文件(可用load()函数载入,见以下代码),这些数据都可以<br />

从《中国统计年鉴》中获得。<br />

1 > source(system.file("extdata", "ChinaPop.R", package = "MSG"))<br />

2 > head(ChinaPop)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!