68 第五章 图库 names, plot = TRUE, border = par("fg"), col = NULL, log = "", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL) 1 > # 公式用法 2 > usage(boxplot, "formula") boxplot(formula, data = NULL, ..., subset, na.action = NULL) 因为boxplot()是一个泛型函数,所以它可以适应不同的参数类型。 目 前它支持两种参数类型:公式(formula)和数据,后者对我们来说可能更 容易理解(给一批数据、作相应的箱线图),而前者在某些情况下更为方 便,后面我们会举例说明。参数x为一个数值向量或者列表,若为列表则对 列表中每一个子对象依次作出箱线图;range是一个延伸倍数,决定了箱线 图的末端(须)延伸到什么位置,这主要是考虑到离群点的原因,在数据 中存在离群点的情况下,将箱线图末端直接延伸到最大值和最小值对描述 数据分布来说并不合适(图形缺乏稳健性),所以R中的箱线图默认只将图 形延伸到离箱子两端range × (Q3 − Q1)处,即上下四分位数分别加/减内 四分位距(Interquartile Range,简称IQR ≡ Q3 − Q1)的倍数,超过这个 范围的数据点就被视作离群点,在图中直接以点的形式表示出来;width给 定箱子的宽度;varwidth为逻辑值,若为TRUE,那么箱子的宽度与样本量 的平方根成比例,这在多批数据同时画多个箱线图时比较有用,能进一步 反映出样本量的大小;notch也是一个有用的逻辑参数,它决定了是否在 箱子上画凹槽,凹槽所表示的实际上是中位数的一个区间估计,其计算式 为Q2 + / − 1.58IQR/ √ n(McGill et al., 1978; Chambers et al., 1983),区间置 信水平为95%,在比较两组数据中位数差异时,我们只需要观察箱线图的 凹槽是否有重叠部分,若两个凹槽互不交叠,那么说明这两组数据的中位 数有显著差异(P值小于0.05);horizontal为逻辑值,设定箱线图是否水平 放置;add设置是否将箱线图添加到现有图形上(例:图5.34);其它参数诸 如设置箱子颜色、位置、更详细的宽度等参见?boxplot。 绘 制 单 个 箱 线 图 时 只 需 要 给boxplot()传 入 一 个 数 值 向 量 即 可,如: boxplot(rnorm(100));这里我们主要使用公式型的参数,以datasets包 中的杀虫剂数据InsectSprays为例;该数据有两列,第一列为昆虫数目, 第二列为杀虫剂种类(ABCDEF),这里是随机抽取的10列数据: 1 > InsectSprays[sample(nrow(InsectSprays), 10), ]
5.3 箱线图 69 1 > par(mar = c(2, 2.5, 0.2, 0.1)) 2 > boxplot(count ~ spray, data = InsectSprays, col = "lightgray", 3 + horizontal = TRUE, pch = 4) A B C D E F count spray 64 22 F 15 21 B 22 21 B 32 1 C 33 3 C 38 5 D 47 2 D 66 16 F 43 5 D 49 3 E 0 5 10 15 20 25 图 5.5: 昆虫数目箱线图:六种杀虫剂下昆虫的数目分布。 为了了解杀虫剂的效果,我们需要对各种杀虫剂下昆虫的数目作出比 较。图5.5是一个简单的箱线图展示,不难看出,除了B和D对应的昆虫数据 呈左偏形态外,其它组均有右偏趋势,看起来各组数据的平均水平差异比 较明显;另外注意观察图中的两个离群点(以“×”表示)。总体看来,C的 效果最好。事实上,我们可以对这个数据作方差分析,检验杀虫剂类型对 昆虫数目是否有显著影响: 1 > insects.aov = aov(count ~ spray, data = InsectSprays)
- Page 1 and 2:
现代统计图形 谢益辉 2010
- Page 3 and 4:
• 自由软件用户往往有某
- Page 5 and 6:
目录 序言 i 代序一 . . . . .
- Page 7 and 8:
5.25 向日葵散点图 . . . . . .
- Page 9:
附录 B 作图技巧 163 B.1 添
- Page 12 and 13:
5.4 泊松分布随机数茎叶图
- Page 15 and 16:
表格 5.1 二维列联表的经典
- Page 17 and 18:
序言 代序一 代序二 作者
- Page 19:
Coefficients: Estimate Std. Error t
- Page 22 and 23:
2 第一章 历史 图 1.1: Playfai
- Page 24 and 25:
4 第一章 历史 吸到了“瘴
- Page 26 and 27:
6 第一章 历史 图 1.4: 南丁
- Page 28 and 29:
8 第一章 历史 图 1.5: Minard
- Page 30 and 31:
10 第一章 历史 总的说来,
- Page 32 and 33:
12 第二章 工具 大小,如条
- Page 34 and 35:
14 第二章 工具 Type contributo
- Page 36 and 37:
16 第二章 工具 百K的一个
- Page 38 and 39: 18 第二章 工具 其实没有必
- Page 40 and 41: 20 第二章 工具
- Page 42 and 43: 22 第三章 细节 3.1 par()函数
- Page 44 and 45: 24 第三章 细节 1:10 2 4 6 8 10
- Page 46 and 47: 26 第三章 细节 las 坐标轴
- Page 48 and 49: 28 第三章 细节 oma[2] mar[2] O
- Page 50 and 51: 30 第三章 细节 3.2 plot()及
- Page 52 and 53: 32 第三章 细节 xlim, ylim 设
- Page 54 and 55: 34 第四章 元素 4.1 颜色 默
- Page 56 and 57: 36 第四章 元素 4.1.2 颜色生
- Page 58 and 59: 38 第四章 元素 [,1] [,2] [,3]
- Page 60 and 61: 40 第四章 元素 每一类调色
- Page 62 and 63: 42 第四章 元素 1 > xx = c(1912
- Page 64 and 65: 44 第四章 元素 0 1 2 3 4 5 6 7
- Page 66 and 67: 46 第四章 元素 图2.1已经使
- Page 68 and 69: 48 第四章 元素 1 > usage(arrow
- Page 70 and 71: 50 第四章 元素 一个多边形
- Page 72 and 73: 52 第四章 元素 可以看到,
- Page 74 and 75: 54 第四章 元素 1 > par(mar = c
- Page 76 and 77: 56 第四章 元素 1 > data(Export
- Page 78 and 79: 58 第四章 元素 12 72.48 2003 U
- Page 80 and 81: 60 第五章 图库 1 > par(mfrow =
- Page 82 and 83: 62 第五章 图库 f(x) = F ′ F
- Page 84 and 85: 64 第五章 图库 1 > stem(island
- Page 86 and 87: 66 第五章 图库 对原始数据
- Page 90 and 91: 70 第五章 图库 1 > par(mar = c
- Page 92 and 93: 72 第五章 图库 1 > # 用分类
- Page 94: 74 第五章 图库 1 > library(MSG
- Page 97 and 98: 5.7 条件密度图 77 R中关联
- Page 99 and 100: 5.7 条件密度图 79 小到大在
- Page 101 and 102: 5.8 等高图 81 1 > data(ChinaLife
- Page 103 and 104: 5.8 等高图 83 都必须展示在
- Page 105 and 106: 5.9 条件分割图 85 1 > par(mar
- Page 107 and 108: 5.10 一元函数曲线图 87 1 > c
- Page 109 and 110: 5.12 颜色等高图 89 1 > dotchar
- Page 111 and 112: 5.13 四瓣图 91 finite = TRUE), y
- Page 113 and 114: 5.13 四瓣图 93 表 5.1: 二维
- Page 115 and 116: 5.14 颜色图 95 C和E系的优比
- Page 117 and 118: 5.14 颜色图 97 1 > par(mar = rep
- Page 119 and 120: 5.15 矩阵图 99 1 > sines = outer
- Page 121 and 122: 5.16 马赛克图 101 1 > ftable(Ti
- Page 123 and 124: 5.17 散点图矩阵 103 较低。
- Page 125 and 126: 5.18 三维透视图 105 倍数;fon
- Page 127 and 128: 5.18 三维透视图 107 Sinc( r )
- Page 129 and 130: 5.19 因素效应图 109 1 > plot.d
- Page 131 and 132: 5.21 平滑散点图 111 1 > par(ma
- Page 133 and 134: 5.22 棘状图 113 可将图5.28放
- Page 135 and 136: 5.22 棘状图 115 离散化处理,
- Page 137 and 138: 5.23 星状图 117 1 > # 预设调
- Page 139 and 140:
5.24 带状图 119 1 > layout(matri
- Page 141 and 142:
5.25 向日葵散点图 121 1 > sun
- Page 143 and 144:
5.26 符号图 123 1 > par(mar = c(
- Page 145:
5.27 饼图 125 增长率 总人口
- Page 148 and 149:
128 第五章 图库 种以比例
- Page 150 and 151:
130 第五章 图库 1 > # 真实
- Page 152 and 153:
132 第五章 图库 信用风险
- Page 154 and 155:
134 第五章 图库 1 > library(rp
- Page 156 and 157:
136 第五章 图库 有时候与
- Page 158 and 159:
138 第五章 图库 数诸如填
- Page 160 and 161:
140 第五章 图库
- Page 162 and 163:
142 第六章 系统 8 > plot(0:1,
- Page 164 and 165:
144 第七章 模型 • 类似回
- Page 166 and 167:
146 第七章 模型 7.16.1 分类
- Page 168 and 169:
148 第八章 数据 8.2.1 一维
- Page 170 and 171:
150 附录 A 程序初步 通常我
- Page 172 and 173:
152 附录 A 程序初步 1 > # 冒
- Page 174 and 175:
154 附录 A 程序初步 [1] 1 2 3
- Page 176 and 177:
156 附录 A 程序初步 [,1] [,2]
- Page 178 and 179:
158 附录 A 程序初步 A.1.5 函
- Page 180 and 181:
160 附录 A 程序初步 [1] "inte
- Page 182 and 183:
162 附录 A 程序初步 2. 变量
- Page 184 and 185:
164 附录 B 作图技巧 1 > # 本
- Page 186 and 187:
166 附录 B 作图技巧 1 > layou
- Page 188 and 189:
168 附录 B 作图技巧 screen(n
- Page 190 and 191:
170 附录 B 作图技巧 B.3 交
- Page 192 and 193:
172 附录 B 作图技巧 1 > xx =
- Page 194 and 195:
174 附录 B 作图技巧 正的频
- Page 196 and 197:
176 附录 B 作图技巧
- Page 198 and 199:
178 附录 C 统计动画
- Page 200 and 201:
180 附录 D 本书R包 D.2 数据
- Page 202 and 203:
182 参考文献 Minka , URL http:/
- Page 204 and 205:
184 参考文献 Meyer D, Zeileis A
- Page 206 and 207:
186 参考文献 Wilkinson L (2005)
- Page 208 and 209:
188 索引 点, 27 玫瑰图, 4 直
- Page 210:
190 索引 形的一些历史,包