现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
现代统计图形 - 科学网—博客
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
162 附录 A 程序初步<br />
2. 变量选择问题:某多元线性回归模型包含了20个自变量,根据某些经<br />
验,自变量的个数在3个左右是最合适的。要求建立所有可能的回归<br />
模型,并根据AIC准则找出最优模型以及相应的自变量。<br />
提示:所有回归模型数目为组合数C 3 20 = 1140,可使用函数combn()生<br />
成所有组合,用lm()建模,并用AIC()提取AIC值。<br />
3. DNA序列的反转互补 3 :给定一个DNA序列字符串,要求将它的字<br />
符序列顺序颠倒过来,然后A与T互换,C与G互换。 例如原序列为<br />
“TTGGTAGTGC”,首先将它顺序反转为“CGTGATGGTT”,然后<br />
互补为“GCACTACCAA”。<br />
提示:可以采用substr()暴力提取每一个字符的方式,然后用繁琐的循<br />
环和选择语句实现本题的要求;但利用R的向量化操作功能会大大加<br />
速计算速度,可采用的函数有:拆分字符串strsplit()、反转向量rev()、<br />
拼接字符串paste()。仔细考虑如何利用名字和整数的下标功能实现序<br />
列的互补。<br />
4. 接受—拒绝抽样(Acceptance-Rejection Sampling):当我们不容易从<br />
某个分布中生成随机数的时候,若有另一个分布的密度函数g(x)能控<br />
制前一个分布的密度函数f(x)的核h(x)(此处“控制”的意思是∃M ><br />
0, h(x)/g(x) ≤ M, ∀x,核h(x)正比于f(x)),而且我们很方便从g(·)中<br />
生成随机数,那么我们可用“接受—拒绝抽样”的方式从f(·)中生成<br />
随机数。步骤如下:<br />
(a) 从g(·)中生成随机数xi;<br />
(b) 从均匀分布U(0, 1)中生成随机数ui;<br />
(c) 若ui ≤ h(xi)/(M · g(xi)),则记下xi;<br />
重复以上步骤若干次,被接受的xi的概率密度函数即为f(·)。根据以<br />
上抽样步骤用适当的循环和选择语句生成服从以下分布的随机数:<br />
exp(θ) 1<br />
f(θ) = c √ exp(−θ<br />
1 + exp(θ) 2π 2 /2)<br />
其中,c为使得f(θ)积分为1的常数。<br />
3 本题源于COS会员iiiiiiiiiii的提问:http://cos.name/cn/topic/18471