130 第五章 图库 1 > # 真实的分位数 2 > qnorm(seq(0.1, 0.9, 0.2)) [1] -1.2816 -0.5244 0.0000 0.5244 1.2816 以上数据的5个分位数和理论分位数都比较接近,读者可以模拟其它分 布,例如从卡方分布中生成随机数,看其分位数是多少,与正态分布分位 数差异如何。 R中QQ图的函数为qqplot(),由于正态分布是我们经常检验的分布, R也直接提供了一个画正态分布QQ图的函数qqnorm(),这两个函数都在基 础包stats包中,它们的用法如下: 1 > usage(qqplot) qqplot(x, y, plot.it = TRUE, xlab = deparse(substitute(x)), ylab = deparse(substitute(y)), ...) 1 > usage(qqnorm, "default") qqnorm(y, ylim, main = "Normal Q-Q Plot", xlab = "Theoretical Quantiles", ylab = "Sample Quantiles", plot.it = TRUE, datax = FALSE, ...) 1 > usage(qqline) qqline(y, datax = FALSE, ...) 由于qqplot()检验的是两批数据的分布是否相同,所以它需要两个数据 参数x和y,qqnorm()只需要一个数据参数x,其它设置标签和标题等元素的 图形参数此处不再赘述。 图5.36左图是喷泉间隔时间数据的正态分布QQ图(5.1小节的直方图用 到过),注意其中的数据经过了标准化,使之均值为0,方差为1。可以看出, 数据点并不呈直线分布,这说明(标准化后的)数据的分布和标准正态分 布有所差异,那么具体是何种差异呢?图的左边有一部分点偏离在直线上 方,说明实际分位数大于理论分位数,从密度曲线的角度来说,也就是实 际数据的分布曲线更偏右一些,理论分布曲线左边的尾巴向左伸得更远, 而图的右边又有一些点在直线下方,说明此处实际分布曲线偏左,即实际 分位数偏小。右图画出了数据的核密度估计曲线(实线)和真正的标准正 态分布密度曲线(虚线),读者可以将二者的对比结合左图来理解QQ图中 数据点偏离直线的方向与分布曲线的偏向关系。
5.31 生存函数图 131 1 > library(survival) 2 > leukemia.surv = survfit(Surv(time, status) ~ x, data = aml) 3 > plot(leukemia.surv, lty = 1:2, xlab = "time") 4 > legend("topright", c("Maintenance", "No Maintenance"), 5 + lty = 1:2, bty = "n") 0.0 0.2 0.4 0.6 0.8 1.0 0 50 100 150 time 图 5.37: 急性髓细胞白血病病人生存函数图 Maintenance No Maintenance 注意图5.36的QQ图中我们用了纵横比参数asp = 1,这样使得图中横 纵坐标的单位长度表示的数值大小相同,为我们比较点的横纵坐标值大小 提供了更好的视觉辅助。 QQ图的用途不仅在检查数据是否服从某种特定理论分布,它也可以 推广到检查数据是否来自某个位置参数分布族。例如,若数据来自正态分 布 5 N(5, 1),我们拿它和标准正态分布N(0, 1)画QQ图的话,数据点仍然会 大致排列在直线上,此时直线的斜率仍然是1,但截距就不是0了,而是5。 5.31 生存函数图 在很多医学研究中,我们主要关心的变量是病人的某种事件发生的时 间,例如死亡、疾病复发等。事实上,以“生存时间”为研究对象的领域 并不仅限于医学,例如在金融领域,我们可能需要了解信用卡持有者的 5 正态分布是位置参数分布族中的一种分布:若X ∼ N(µ, σ 2 ),那么X + δ ∼ N(µ + δ, σ 2 )仍然是 正态分布。均值µ是位置参数。
- Page 1 and 2:
现代统计图形 谢益辉 2010
- Page 3 and 4:
• 自由软件用户往往有某
- Page 5 and 6:
目录 序言 i 代序一 . . . . .
- Page 7 and 8:
5.25 向日葵散点图 . . . . . .
- Page 9:
附录 B 作图技巧 163 B.1 添
- Page 12 and 13:
5.4 泊松分布随机数茎叶图
- Page 15 and 16:
表格 5.1 二维列联表的经典
- Page 17 and 18:
序言 代序一 代序二 作者
- Page 19:
Coefficients: Estimate Std. Error t
- Page 22 and 23:
2 第一章 历史 图 1.1: Playfai
- Page 24 and 25:
4 第一章 历史 吸到了“瘴
- Page 26 and 27:
6 第一章 历史 图 1.4: 南丁
- Page 28 and 29:
8 第一章 历史 图 1.5: Minard
- Page 30 and 31:
10 第一章 历史 总的说来,
- Page 32 and 33:
12 第二章 工具 大小,如条
- Page 34 and 35:
14 第二章 工具 Type contributo
- Page 36 and 37:
16 第二章 工具 百K的一个
- Page 38 and 39:
18 第二章 工具 其实没有必
- Page 40 and 41:
20 第二章 工具
- Page 42 and 43:
22 第三章 细节 3.1 par()函数
- Page 44 and 45:
24 第三章 细节 1:10 2 4 6 8 10
- Page 46 and 47:
26 第三章 细节 las 坐标轴
- Page 48 and 49:
28 第三章 细节 oma[2] mar[2] O
- Page 50 and 51:
30 第三章 细节 3.2 plot()及
- Page 52 and 53:
32 第三章 细节 xlim, ylim 设
- Page 54 and 55:
34 第四章 元素 4.1 颜色 默
- Page 56 and 57:
36 第四章 元素 4.1.2 颜色生
- Page 58 and 59:
38 第四章 元素 [,1] [,2] [,3]
- Page 60 and 61:
40 第四章 元素 每一类调色
- Page 62 and 63:
42 第四章 元素 1 > xx = c(1912
- Page 64 and 65:
44 第四章 元素 0 1 2 3 4 5 6 7
- Page 66 and 67:
46 第四章 元素 图2.1已经使
- Page 68 and 69:
48 第四章 元素 1 > usage(arrow
- Page 70 and 71:
50 第四章 元素 一个多边形
- Page 72 and 73:
52 第四章 元素 可以看到,
- Page 74 and 75:
54 第四章 元素 1 > par(mar = c
- Page 76 and 77:
56 第四章 元素 1 > data(Export
- Page 78 and 79:
58 第四章 元素 12 72.48 2003 U
- Page 80 and 81:
60 第五章 图库 1 > par(mfrow =
- Page 82 and 83:
62 第五章 图库 f(x) = F ′ F
- Page 84 and 85:
64 第五章 图库 1 > stem(island
- Page 86 and 87:
66 第五章 图库 对原始数据
- Page 88 and 89:
68 第五章 图库 names, plot = T
- Page 90 and 91:
70 第五章 图库 1 > par(mar = c
- Page 92 and 93:
72 第五章 图库 1 > # 用分类
- Page 94:
74 第五章 图库 1 > library(MSG
- Page 97 and 98:
5.7 条件密度图 77 R中关联
- Page 99 and 100: 5.7 条件密度图 79 小到大在
- Page 101 and 102: 5.8 等高图 81 1 > data(ChinaLife
- Page 103 and 104: 5.8 等高图 83 都必须展示在
- Page 105 and 106: 5.9 条件分割图 85 1 > par(mar
- Page 107 and 108: 5.10 一元函数曲线图 87 1 > c
- Page 109 and 110: 5.12 颜色等高图 89 1 > dotchar
- Page 111 and 112: 5.13 四瓣图 91 finite = TRUE), y
- Page 113 and 114: 5.13 四瓣图 93 表 5.1: 二维
- Page 115 and 116: 5.14 颜色图 95 C和E系的优比
- Page 117 and 118: 5.14 颜色图 97 1 > par(mar = rep
- Page 119 and 120: 5.15 矩阵图 99 1 > sines = outer
- Page 121 and 122: 5.16 马赛克图 101 1 > ftable(Ti
- Page 123 and 124: 5.17 散点图矩阵 103 较低。
- Page 125 and 126: 5.18 三维透视图 105 倍数;fon
- Page 127 and 128: 5.18 三维透视图 107 Sinc( r )
- Page 129 and 130: 5.19 因素效应图 109 1 > plot.d
- Page 131 and 132: 5.21 平滑散点图 111 1 > par(ma
- Page 133 and 134: 5.22 棘状图 113 可将图5.28放
- Page 135 and 136: 5.22 棘状图 115 离散化处理,
- Page 137 and 138: 5.23 星状图 117 1 > # 预设调
- Page 139 and 140: 5.24 带状图 119 1 > layout(matri
- Page 141 and 142: 5.25 向日葵散点图 121 1 > sun
- Page 143 and 144: 5.26 符号图 123 1 > par(mar = c(
- Page 145: 5.27 饼图 125 增长率 总人口
- Page 148 and 149: 128 第五章 图库 种以比例
- Page 152 and 153: 132 第五章 图库 信用风险
- Page 154 and 155: 134 第五章 图库 1 > library(rp
- Page 156 and 157: 136 第五章 图库 有时候与
- Page 158 and 159: 138 第五章 图库 数诸如填
- Page 160 and 161: 140 第五章 图库
- Page 162 and 163: 142 第六章 系统 8 > plot(0:1,
- Page 164 and 165: 144 第七章 模型 • 类似回
- Page 166 and 167: 146 第七章 模型 7.16.1 分类
- Page 168 and 169: 148 第八章 数据 8.2.1 一维
- Page 170 and 171: 150 附录 A 程序初步 通常我
- Page 172 and 173: 152 附录 A 程序初步 1 > # 冒
- Page 174 and 175: 154 附录 A 程序初步 [1] 1 2 3
- Page 176 and 177: 156 附录 A 程序初步 [,1] [,2]
- Page 178 and 179: 158 附录 A 程序初步 A.1.5 函
- Page 180 and 181: 160 附录 A 程序初步 [1] "inte
- Page 182 and 183: 162 附录 A 程序初步 2. 变量
- Page 184 and 185: 164 附录 B 作图技巧 1 > # 本
- Page 186 and 187: 166 附录 B 作图技巧 1 > layou
- Page 188 and 189: 168 附录 B 作图技巧 screen(n
- Page 190 and 191: 170 附录 B 作图技巧 B.3 交
- Page 192 and 193: 172 附录 B 作图技巧 1 > xx =
- Page 194 and 195: 174 附录 B 作图技巧 正的频
- Page 196 and 197: 176 附录 B 作图技巧
- Page 198 and 199: 178 附录 C 统计动画
- Page 200 and 201:
180 附录 D 本书R包 D.2 数据
- Page 202 and 203:
182 参考文献 Minka , URL http:/
- Page 204 and 205:
184 参考文献 Meyer D, Zeileis A
- Page 206 and 207:
186 参考文献 Wilkinson L (2005)
- Page 208 and 209:
188 索引 点, 27 玫瑰图, 4 直
- Page 210:
190 索引 形的一些历史,包