Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
茶 树 查 尔 酮 异 构 酶 基 因 mRNA 及<br />
蛋 白 质 序 列 的 生 物 信 息 学 分 析<br />
小 组 :G10<br />
报 告 人 : 王 丹<br />
组 员 : 周 艳 华 胡 娟<br />
李 丽 田<br />
2013/6/21<br />
www.themegallery.com
一<br />
研 究 背 景<br />
二<br />
序 列 比 对 和 系 统 发 育 分 析<br />
三<br />
基 因 mRNA 全 长 序 列 分 析<br />
四<br />
蛋 白 质 序 列 分 析<br />
www.themegallery.com
研 究 背 景<br />
花 卉 颜 色 物 质 以 类 黄 酮 色 素 中 主 要 色 素 —— 花 色 素 苷 对 花 色 作 用 最 重 要<br />
花 色 素 合 成 生 物 途 径 中 查 尔 酮 合 酶 含 量 直 接 影 响 着 花 色 素 在 花 瓣 中 的<br />
含 量 高 低 , 改 变 了 花 的 颜 色 。<br />
科 学 家 们 通 过 基 因 工 程 技 术 改 变 了 查 尔 酮 的 含 量 , 得 到 了 颜 色 各 异 ,<br />
绚 烂 多 姿 的 花 朵 。<br />
矮 牵 牛 因 查 尔 酮 合 酶 基 因 改 变 而 颜 色 各 异<br />
www.themegallery.com
• 茶 叶 次 生 代 谢 产 物 儿 茶 素 因 较 强 的 抗 氧 化 作<br />
用 越 来 越 受 到 人 们 的 重 视 。<br />
• 儿 茶 素 合 成 途 径 中 的 第 一 个 中 间 产 物 是 查 尔<br />
酮 , 由 查 尔 酮 合 成 酶 (CHS) 催 化 。<br />
• 查 尔 酮 异 构 酶 (CHI) 是 黄 酮 类 代 谢 途 径 中 的<br />
早 期 酶 , 也 是 增 加 黄 酮 醇 产 物 的 关 键 酶 之 一<br />
, 它 催 化 查 尔 酮 异 构 化 为 黄 烷 酮 柑 橘 素 。<br />
www.themegallery.com
• 黄 烷 酮 柑 橘 素 是 类 黄 酮 合 成 途 径 中 第<br />
一 个 稳 定 中 间 产 物 , 再 经 F3H、DFR<br />
等 的 催 化 作 用 可 生 成 一 系 列 常 见 的 次<br />
生 代 谢 产 物 , 从 而 形 成 其 他 黄 酮 类 物<br />
质 。<br />
• 从 Genbank 搜 索 DQ904329 登 录 号 ,<br />
然 后 对 茶 树 查 尔 酮 异 构 酶 基 因 (CHI)<br />
mRNA 全 长 序 列 进 行 生 物 信 息 学 分 析<br />
www.themegallery.com
序 列 比 对 和 系 统 发 育 分 析<br />
用 blastn 进 行 同 源 比 对 , 参 数 经 多 次 调 试 为 期 望 值 :1e-1 比 较 理 想 。<br />
空 位 罚 分 0.4, 茶 树 的 类 黄 酮 异 构 酶 基 因 与 同 属 的 红 花 油 茶<br />
(Camellia chekiangoleosa) 隔 离 种 zjs01 中 的 查 尔 酮 异 构 酶 基 因<br />
相 似 性 达 到 了 99%。 与 番 茄 中 的 CHI protein 相 似 性 达 到 了 81%。 与<br />
马 铃 薯 的 查 尔 酮 异 构 酶 也 都 具 有 较 高 的 相 似 性 。<br />
www.themegallery.com
应 用 MAGA 软 件 将 茶 树 CHI 编 码 的 氨 基 酸 序 列 及 从<br />
GenBank 中 获 取 的 其 他 植 物 CHI 氨 基 酸 序 列 进 行 系 统<br />
树 分 析 , 发 现 茶 树 与 番 茄 最 先 聚 类 合 并 , 而 与 其 它 物<br />
种 , 如 烟 草 、 拟 南 芥 等 在 进 化 上 的 亲 缘 关 系 则 较 远 。<br />
www.themegallery.com
基 因 mRNA 全 长 序 列 分 析<br />
PLOTORF<br />
PlotORF 从 6 个 frame 着 手 寻 找 mRNA 的 开 放 阅 读 框 。F1 是<br />
最 有 可 能 的 读 码 框 , 可 看 出 正 向 从 第 一 个 碱 基 (F1) 开 始<br />
读 起 才 能 在 91-810 左 右 读 到 最 完 整 的 可 连 续 编 码 蛋 白 质 序<br />
列 的 读 码 框 。<br />
www.themegallery.com
SHOWORF of DQ904329 from 1 to 1002<br />
ShowORF 用 特 殊 的 格 式 陈 列 全 长 mRNA 核 酸 序 列 和 翻 译 的 蛋 白 质<br />
序 列 , 从 90bp 到 810bp 之 间 的 开 放 阅 读 框 最 长 , 最 可 信 。1-90 虽 然<br />
也 能 连 续 编 码 氨 基 酸 , 但 不 是 有 起 始 密 码 子 开 始 的 ,810 之 前 的 三 个<br />
密 码 子 是 终 止 密 码 子 , 因 此 此 后 的 序 列 不 属 于 编 码 区 。<br />
www.themegallery.com
sixpack<br />
>DQ904329_1_ORF2 Translation of DQ904329 in frame 1, ORF 2,<br />
threshold 100, 262aa<br />
HSQPKPPSKISHISLLNSHRQRMATTVEDITAKAKMVSLEALTPK<br />
EEKVNGPESNKIADGEMGKADEEPQMGKKDDVPVETEPKTGV<br />
SFPIKLDDGKQLNAVGLRKKSVLGIGIKIYGFGIYADNETLKDLLR<br />
TKIGKAPTKPTKEMYQLVIDSDVGMLVRLVMVFSNLTMSMVRK<br />
NFDEVLGASIKKLTGGKNDELTKKIMGEASDDIKLTCGSIIEISRL<br />
PGYILQTKVMDEVVSKVESELLCRAYTHMYLGDDPFDKEA<br />
SixPack 程 序 : 用 于 寻 找 开 放 阅 读 框 , 以 多 肽 序 列 呈 现 。<br />
需 要 将 最 后 一 条 参 数 (ORF start with an M) 设 置 为<br />
Yes, 运 行 后 有 多 个 结 果 , 其 中 一 条 结 果 最 可 信 ( 如 图 )<br />
有 262 个 氨 基 酸 残 基 。<br />
www.themegallery.com
getorf<br />
>DQ904329_5 [91 - 810] Camellia sinensis chalcone isomerase (CHI) mRNA,<br />
complete cds.<br />
atggcaaccaccgtggaggatatcactgccaaggctaagatggtttccttagaggcactgacacctaaa<br />
gaggagaaagtgaatggccctgaatcaaataagattgccgatggtgagatggggaaagctgatgaag<br />
agccacaaatgggcaagaaagatgacgtgccggttgagactgaacccaagaccggggtctcctttcc<br />
gattaagttggatgatgggaagcagttgaatgcggttgggttgaggaaaaaaagcgtgcttggcatcgg<br />
catcaaaatctatggcttcggaatatatgcagataatgagacactgaaagatcttctgaggacaaaaatt<br />
gggaaagcaccaacaaaacctaccaaggaaatgtaccaactggtaattgacagtgatgtaggaatgct<br />
ggtgcgattggtaatggtgttttccaacctcacaatgagcatggtaagaaagaactttgatgaagttcttg<br />
gagcatctatcaaaaagctcactggtggaaagaatgacgagctcacaaagaagattatgggtgaagct<br />
tcagatgacataaagctgacatgtggttcaataattgagatttctcggcttccaggatacattctccaaaca<br />
aaagtgatggatgaagttgtgagcaaggttgaaagtgaactcctatgcagggcctatacccacatgtatc<br />
ttggagatgatccttttgacaaggaagca<br />
getorf(v6.0.1): 该 软 件 用 于 寻 找 和 提 取 开 放 阅 读 框 。 将 输 出 类 型<br />
(Type of output) 设 置 为 “ 在 起 始 密 码 子 和 终 止 密 码 子 之 间 翻 译 ”<br />
(Nucleic sequences between START and STOP codon), 其<br />
它 参 数 不 变 , 输 出 的 是 可 能 的 编 码 区 结 果 。 编 码 区 长 度 不 同 , 选 取<br />
最 长 的 那 条 ( 如 图 ), 该 结 果 有 720 个 碱 基 。<br />
www.themegallery.com
getorf<br />
• >DQ904329_5 [91 - 810] Camellia sinensis chalcone isomerase (CHI)<br />
mRNA, complete cds.<br />
MATTVEDITAKAKVSLEALTPKEEKVNGPESNKIADGEMGKADEEPQM<br />
GKKDDVPVETEPKTGVSFPIKLDDGKQLNAVGLRKKSVLGIGIKIYGFGI<br />
YADNETLKDLLRTKIGKAPTKPTKEMYQLVIDSDVGMLVRLVMVFSNLT<br />
MSMVRKNFDEVLGASIKKLTGGKNDELTKKIMGEASDDIKLTCGSIIEIS<br />
RLPGYILQTKVMDEVVSKVESELLCRAYTHMYLGDDPFDKEA<br />
将 输 出 类 型 (Type of output) 设 置 为 “ 在 起 始 密 码 子 和 终 止<br />
密 码 子 之 间 翻 译 ”(Translation of regions between START<br />
and STOP codon), 其 它 参 数 不 变 。 有 24 个 结 果 , 翻 译 的 蛋<br />
白 质 长 度 不 同 , 选 取 最 长 的 那 条 ( 如 图 ), 共 240 氨 基 酸 残 基 。<br />
www.themegallery.com
密 码 子 偏 好 性 分 析<br />
# CHIPS codon usage statistics<br />
Nc = 58.300<br />
• CUSP<br />
Coding GC 44.03%<br />
#1st letter GC 52.08%<br />
#2nd letter GC 33.33%<br />
#3rd letter GC 46.67%<br />
chips 和 cusp<br />
Nc 数 在 20 到 61 之 间 , 数 字 越 高 代 表 很 低 的 密<br />
码 子 偏 好 程 度 , 越 低 代 表 越 强 的 密 码 子 偏 好<br />
程 度 。Nc=58.3 表 明 CHI 基 因 密 码 子 使 用 的 偏<br />
好 度 低 。 GC 含 量 大 概 是 44% 左 右 。<br />
www.themegallery.com
蛋 白 质 序 列 分 析<br />
1、 用 weblab 中 pepstats 分 析 查 尔 酮 异 构 酶<br />
氨 基 酸 组 成 情 况 :<br />
PEPSTATS of Q0G877_CAMSI from 1 to 240<br />
Molecular weight = 26354.53 Residues = 240<br />
Average Residue Weight = 109.811 Charge = -3.5<br />
Isoelectric Point = 5.0902<br />
A280 Molar Extinction Coefficient = 7680<br />
A280 Extinction Coefficient 1mg/ml = 0.29<br />
Improbability of expression in inclusion bodies = 0.527<br />
www.themegallery.com
Residue Number Mole% DayhoffStat<br />
A = Ala 13 5.417 0.630<br />
B = Asx 0 0.000 0.000<br />
C = Cys 2 0.833 0.287<br />
D = Asp 19 7.917 1.439<br />
E = Glu 20 8.333 1.389<br />
F = Phe 5 2.083 0.579<br />
G = Gly 20 8.333 0.992<br />
H = His 1 0.417 0.208<br />
I = Ile 16 6.667 1.481<br />
J = --- 0 0.000 0.000<br />
K = Lys 29 12.083 1.831<br />
L = Leu 22 9.167 1.239<br />
M = Met 12 5.000 2.941<br />
N = Asn 7 2.917 0.678<br />
O = --- 0 0.000 0.000<br />
P = Pro 10 4.167 0.801<br />
Q = Gln 4 1.667 0.427<br />
R = Arg 6 2.500 0.510<br />
S = Ser 13 5.417 0.774<br />
T = Thr 16 6.667 1.093<br />
U = --- 0 0.000 0.000<br />
V = Val 19 7.917 1.199<br />
W = Trp 0 0.000 0.000<br />
X = Xaa 0 0.000 0.000<br />
Y = Tyr 6 2.500 0.735<br />
Z = Glx 0 0.000 0.000<br />
www.themegallery.com
Property Residues Number Mole%<br />
Tiny (A+C+G+S+T) 64 26.667<br />
Small (A+B+C+D+G+N+P+S+T+V) 119 49.583<br />
Aliphatic (A+I+L+V) 70 29.167<br />
Aromatic (F+H+W+Y) 12 5.000<br />
Non-polar (A+C+F+G+I+L+M+P+V+W+Y) 125 52.083<br />
Polar (D+E+H+K+N+Q+R+S+T+Z) 115 47.917<br />
Charged (B+D+E+H+K+R+Z) 75 31.250<br />
Basic (H+K+R) 36 15.000<br />
Acidic (B+D+E+Z) 39 16.250<br />
该 酶 的 等 电 点 为 5.0902, 含 有 的 极 性 氨<br />
基 酸 占 47.917%, 非 极 性 占 52.083%,<br />
带 电 的 氨 基 酸 有 75 个 , 占 31.250%, 总 带<br />
的 电 荷 量 为 -3.5。<br />
www.themegallery.com
2、 用 ExPASy 中 protscale 对 该 酶 进 行<br />
疏 水 性 和 亲 水 性 分 析<br />
图 中 以 0 为 界 , 正 值 表 示 疏 水 , 负 值 表 示 亲 水 。<br />
www.themegallery.com
3、 用 ExPASy 中 TMHMM 分 析 跨 膜 螺 旋<br />
由 上 图 可 以 看 出 , 该 蛋 白 质 无 跨 膜 区 , 蛋 白 全 部 在 膜 外 。 曲<br />
线 的 纵 坐 标 是 概 率 , 横 坐 标 是 序 列 , 一 共 240 个 氨 基 酸 , 红<br />
色 表 示 跨 膜 区 , 几 乎 都 在 5% 概 率 下 , 蓝 色 inside 即 在 膜 内 部<br />
, 概 率 极 低 ; 相 反 紫 色 细 线 表 示 在 膜 外 的 概 率 有 85%。 因 此 1<br />
到 240 位 氨 基 酸 全 部 是 outside。<br />
www.themegallery.com
4、 用 CBS 中 signal 对 该 酶 进 行 信 号 肽 分 析<br />
图 中 可 见 ,C 、S、Y 三 项 得 分 均 较 低 , 因 此 该 蛋 白 不 含 信 号 肽<br />
www.themegallery.com
5、 用 CBS 中 targetP 对 该 酶 进 行 亚 细 胞 定 位<br />
loc 中 显 示 的 是 “-” 表 示 该 蛋 白 在 任 何 位 置 都 有 存 在 。<br />
www.themegallery.com
6、 通 过 ExPASy 中 SOPMA 对 该 酶 二 级 结 构 进<br />
行 预 测<br />
由 图 中 可 以 看 出 该 酶 中 的 二 级 结 构 主 要 有 α 螺 旋 (40.42%),<br />
无 规 则 卷 曲 (30.83%) 和 β 折 叠 (7.08%)。<br />
www.themegallery.com
www.themegallery.com