02.07.2013 Views

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

现代统计图形 - 科学网—博客

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

162 附录 A 程序初步<br />

2. 变量选择问题:某多元线性回归模型包含了20个自变量,根据某些经<br />

验,自变量的个数在3个左右是最合适的。要求建立所有可能的回归<br />

模型,并根据AIC准则找出最优模型以及相应的自变量。<br />

提示:所有回归模型数目为组合数C 3 20 = 1140,可使用函数combn()生<br />

成所有组合,用lm()建模,并用AIC()提取AIC值。<br />

3. DNA序列的反转互补 3 :给定一个DNA序列字符串,要求将它的字<br />

符序列顺序颠倒过来,然后A与T互换,C与G互换。 例如原序列为<br />

“TTGGTAGTGC”,首先将它顺序反转为“CGTGATGGTT”,然后<br />

互补为“GCACTACCAA”。<br />

提示:可以采用substr()暴力提取每一个字符的方式,然后用繁琐的循<br />

环和选择语句实现本题的要求;但利用R的向量化操作功能会大大加<br />

速计算速度,可采用的函数有:拆分字符串strsplit()、反转向量rev()、<br />

拼接字符串paste()。仔细考虑如何利用名字和整数的下标功能实现序<br />

列的互补。<br />

4. 接受—拒绝抽样(Acceptance-Rejection Sampling):当我们不容易从<br />

某个分布中生成随机数的时候,若有另一个分布的密度函数g(x)能控<br />

制前一个分布的密度函数f(x)的核h(x)(此处“控制”的意思是∃M ><br />

0, h(x)/g(x) ≤ M, ∀x,核h(x)正比于f(x)),而且我们很方便从g(·)中<br />

生成随机数,那么我们可用“接受—拒绝抽样”的方式从f(·)中生成<br />

随机数。步骤如下:<br />

(a) 从g(·)中生成随机数xi;<br />

(b) 从均匀分布U(0, 1)中生成随机数ui;<br />

(c) 若ui ≤ h(xi)/(M · g(xi)),则记下xi;<br />

重复以上步骤若干次,被接受的xi的概率密度函数即为f(·)。根据以<br />

上抽样步骤用适当的循环和选择语句生成服从以下分布的随机数:<br />

exp(θ) 1<br />

f(θ) = c √ exp(−θ<br />

1 + exp(θ) 2π 2 /2)<br />

其中,c为使得f(θ)积分为1的常数。<br />

3 本题源于COS会员iiiiiiiiiii的提问:http://cos.name/cn/topic/18471

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!