21.04.2015 Views

茶树查尔酮异构酶基因mRNA及蛋白质序列的生物信息学分析 - abc

茶树查尔酮异构酶基因mRNA及蛋白质序列的生物信息学分析 - abc

茶树查尔酮异构酶基因mRNA及蛋白质序列的生物信息学分析 - abc

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

茶 树 查 尔 酮 异 构 酶 基 因 mRNA 及<br />

蛋 白 质 序 列 的 生 物 信 息 学 分 析<br />

小 组 :G10<br />

报 告 人 : 王 丹<br />

组 员 : 周 艳 华 胡 娟<br />

李 丽 田<br />

2013/6/21<br />

www.themegallery.com


一<br />

研 究 背 景<br />

二<br />

序 列 比 对 和 系 统 发 育 分 析<br />

三<br />

基 因 mRNA 全 长 序 列 分 析<br />

四<br />

蛋 白 质 序 列 分 析<br />

www.themegallery.com


研 究 背 景<br />

花 卉 颜 色 物 质 以 类 黄 酮 色 素 中 主 要 色 素 —— 花 色 素 苷 对 花 色 作 用 最 重 要<br />

花 色 素 合 成 生 物 途 径 中 查 尔 酮 合 酶 含 量 直 接 影 响 着 花 色 素 在 花 瓣 中 的<br />

含 量 高 低 , 改 变 了 花 的 颜 色 。<br />

科 学 家 们 通 过 基 因 工 程 技 术 改 变 了 查 尔 酮 的 含 量 , 得 到 了 颜 色 各 异 ,<br />

绚 烂 多 姿 的 花 朵 。<br />

矮 牵 牛 因 查 尔 酮 合 酶 基 因 改 变 而 颜 色 各 异<br />

www.themegallery.com


• 茶 叶 次 生 代 谢 产 物 儿 茶 素 因 较 强 的 抗 氧 化 作<br />

用 越 来 越 受 到 人 们 的 重 视 。<br />

• 儿 茶 素 合 成 途 径 中 的 第 一 个 中 间 产 物 是 查 尔<br />

酮 , 由 查 尔 酮 合 成 酶 (CHS) 催 化 。<br />

• 查 尔 酮 异 构 酶 (CHI) 是 黄 酮 类 代 谢 途 径 中 的<br />

早 期 酶 , 也 是 增 加 黄 酮 醇 产 物 的 关 键 酶 之 一<br />

, 它 催 化 查 尔 酮 异 构 化 为 黄 烷 酮 柑 橘 素 。<br />

www.themegallery.com


• 黄 烷 酮 柑 橘 素 是 类 黄 酮 合 成 途 径 中 第<br />

一 个 稳 定 中 间 产 物 , 再 经 F3H、DFR<br />

等 的 催 化 作 用 可 生 成 一 系 列 常 见 的 次<br />

生 代 谢 产 物 , 从 而 形 成 其 他 黄 酮 类 物<br />

质 。<br />

• 从 Genbank 搜 索 DQ904329 登 录 号 ,<br />

然 后 对 茶 树 查 尔 酮 异 构 酶 基 因 (CHI)<br />

mRNA 全 长 序 列 进 行 生 物 信 息 学 分 析<br />

www.themegallery.com


序 列 比 对 和 系 统 发 育 分 析<br />

用 blastn 进 行 同 源 比 对 , 参 数 经 多 次 调 试 为 期 望 值 :1e-1 比 较 理 想 。<br />

空 位 罚 分 0.4, 茶 树 的 类 黄 酮 异 构 酶 基 因 与 同 属 的 红 花 油 茶<br />

(Camellia chekiangoleosa) 隔 离 种 zjs01 中 的 查 尔 酮 异 构 酶 基 因<br />

相 似 性 达 到 了 99%。 与 番 茄 中 的 CHI protein 相 似 性 达 到 了 81%。 与<br />

马 铃 薯 的 查 尔 酮 异 构 酶 也 都 具 有 较 高 的 相 似 性 。<br />

www.themegallery.com


应 用 MAGA 软 件 将 茶 树 CHI 编 码 的 氨 基 酸 序 列 及 从<br />

GenBank 中 获 取 的 其 他 植 物 CHI 氨 基 酸 序 列 进 行 系 统<br />

树 分 析 , 发 现 茶 树 与 番 茄 最 先 聚 类 合 并 , 而 与 其 它 物<br />

种 , 如 烟 草 、 拟 南 芥 等 在 进 化 上 的 亲 缘 关 系 则 较 远 。<br />

www.themegallery.com


基 因 mRNA 全 长 序 列 分 析<br />

PLOTORF<br />

PlotORF 从 6 个 frame 着 手 寻 找 mRNA 的 开 放 阅 读 框 。F1 是<br />

最 有 可 能 的 读 码 框 , 可 看 出 正 向 从 第 一 个 碱 基 (F1) 开 始<br />

读 起 才 能 在 91-810 左 右 读 到 最 完 整 的 可 连 续 编 码 蛋 白 质 序<br />

列 的 读 码 框 。<br />

www.themegallery.com


SHOWORF of DQ904329 from 1 to 1002<br />

ShowORF 用 特 殊 的 格 式 陈 列 全 长 mRNA 核 酸 序 列 和 翻 译 的 蛋 白 质<br />

序 列 , 从 90bp 到 810bp 之 间 的 开 放 阅 读 框 最 长 , 最 可 信 。1-90 虽 然<br />

也 能 连 续 编 码 氨 基 酸 , 但 不 是 有 起 始 密 码 子 开 始 的 ,810 之 前 的 三 个<br />

密 码 子 是 终 止 密 码 子 , 因 此 此 后 的 序 列 不 属 于 编 码 区 。<br />

www.themegallery.com


sixpack<br />

>DQ904329_1_ORF2 Translation of DQ904329 in frame 1, ORF 2,<br />

threshold 100, 262aa<br />

HSQPKPPSKISHISLLNSHRQRMATTVEDITAKAKMVSLEALTPK<br />

EEKVNGPESNKIADGEMGKADEEPQMGKKDDVPVETEPKTGV<br />

SFPIKLDDGKQLNAVGLRKKSVLGIGIKIYGFGIYADNETLKDLLR<br />

TKIGKAPTKPTKEMYQLVIDSDVGMLVRLVMVFSNLTMSMVRK<br />

NFDEVLGASIKKLTGGKNDELTKKIMGEASDDIKLTCGSIIEISRL<br />

PGYILQTKVMDEVVSKVESELLCRAYTHMYLGDDPFDKEA<br />

SixPack 程 序 : 用 于 寻 找 开 放 阅 读 框 , 以 多 肽 序 列 呈 现 。<br />

需 要 将 最 后 一 条 参 数 (ORF start with an M) 设 置 为<br />

Yes, 运 行 后 有 多 个 结 果 , 其 中 一 条 结 果 最 可 信 ( 如 图 )<br />

有 262 个 氨 基 酸 残 基 。<br />

www.themegallery.com


getorf<br />

>DQ904329_5 [91 - 810] Camellia sinensis chalcone isomerase (CHI) mRNA,<br />

complete cds.<br />

atggcaaccaccgtggaggatatcactgccaaggctaagatggtttccttagaggcactgacacctaaa<br />

gaggagaaagtgaatggccctgaatcaaataagattgccgatggtgagatggggaaagctgatgaag<br />

agccacaaatgggcaagaaagatgacgtgccggttgagactgaacccaagaccggggtctcctttcc<br />

gattaagttggatgatgggaagcagttgaatgcggttgggttgaggaaaaaaagcgtgcttggcatcgg<br />

catcaaaatctatggcttcggaatatatgcagataatgagacactgaaagatcttctgaggacaaaaatt<br />

gggaaagcaccaacaaaacctaccaaggaaatgtaccaactggtaattgacagtgatgtaggaatgct<br />

ggtgcgattggtaatggtgttttccaacctcacaatgagcatggtaagaaagaactttgatgaagttcttg<br />

gagcatctatcaaaaagctcactggtggaaagaatgacgagctcacaaagaagattatgggtgaagct<br />

tcagatgacataaagctgacatgtggttcaataattgagatttctcggcttccaggatacattctccaaaca<br />

aaagtgatggatgaagttgtgagcaaggttgaaagtgaactcctatgcagggcctatacccacatgtatc<br />

ttggagatgatccttttgacaaggaagca<br />

getorf(v6.0.1): 该 软 件 用 于 寻 找 和 提 取 开 放 阅 读 框 。 将 输 出 类 型<br />

(Type of output) 设 置 为 “ 在 起 始 密 码 子 和 终 止 密 码 子 之 间 翻 译 ”<br />

(Nucleic sequences between START and STOP codon), 其<br />

它 参 数 不 变 , 输 出 的 是 可 能 的 编 码 区 结 果 。 编 码 区 长 度 不 同 , 选 取<br />

最 长 的 那 条 ( 如 图 ), 该 结 果 有 720 个 碱 基 。<br />

www.themegallery.com


getorf<br />

• >DQ904329_5 [91 - 810] Camellia sinensis chalcone isomerase (CHI)<br />

mRNA, complete cds.<br />

MATTVEDITAKAKVSLEALTPKEEKVNGPESNKIADGEMGKADEEPQM<br />

GKKDDVPVETEPKTGVSFPIKLDDGKQLNAVGLRKKSVLGIGIKIYGFGI<br />

YADNETLKDLLRTKIGKAPTKPTKEMYQLVIDSDVGMLVRLVMVFSNLT<br />

MSMVRKNFDEVLGASIKKLTGGKNDELTKKIMGEASDDIKLTCGSIIEIS<br />

RLPGYILQTKVMDEVVSKVESELLCRAYTHMYLGDDPFDKEA<br />

将 输 出 类 型 (Type of output) 设 置 为 “ 在 起 始 密 码 子 和 终 止<br />

密 码 子 之 间 翻 译 ”(Translation of regions between START<br />

and STOP codon), 其 它 参 数 不 变 。 有 24 个 结 果 , 翻 译 的 蛋<br />

白 质 长 度 不 同 , 选 取 最 长 的 那 条 ( 如 图 ), 共 240 氨 基 酸 残 基 。<br />

www.themegallery.com


密 码 子 偏 好 性 分 析<br />

# CHIPS codon usage statistics<br />

Nc = 58.300<br />

• CUSP<br />

Coding GC 44.03%<br />

#1st letter GC 52.08%<br />

#2nd letter GC 33.33%<br />

#3rd letter GC 46.67%<br />

chips 和 cusp<br />

Nc 数 在 20 到 61 之 间 , 数 字 越 高 代 表 很 低 的 密<br />

码 子 偏 好 程 度 , 越 低 代 表 越 强 的 密 码 子 偏 好<br />

程 度 。Nc=58.3 表 明 CHI 基 因 密 码 子 使 用 的 偏<br />

好 度 低 。 GC 含 量 大 概 是 44% 左 右 。<br />

www.themegallery.com


蛋 白 质 序 列 分 析<br />

1、 用 weblab 中 pepstats 分 析 查 尔 酮 异 构 酶<br />

氨 基 酸 组 成 情 况 :<br />

PEPSTATS of Q0G877_CAMSI from 1 to 240<br />

Molecular weight = 26354.53 Residues = 240<br />

Average Residue Weight = 109.811 Charge = -3.5<br />

Isoelectric Point = 5.0902<br />

A280 Molar Extinction Coefficient = 7680<br />

A280 Extinction Coefficient 1mg/ml = 0.29<br />

Improbability of expression in inclusion bodies = 0.527<br />

www.themegallery.com


Residue Number Mole% DayhoffStat<br />

A = Ala 13 5.417 0.630<br />

B = Asx 0 0.000 0.000<br />

C = Cys 2 0.833 0.287<br />

D = Asp 19 7.917 1.439<br />

E = Glu 20 8.333 1.389<br />

F = Phe 5 2.083 0.579<br />

G = Gly 20 8.333 0.992<br />

H = His 1 0.417 0.208<br />

I = Ile 16 6.667 1.481<br />

J = --- 0 0.000 0.000<br />

K = Lys 29 12.083 1.831<br />

L = Leu 22 9.167 1.239<br />

M = Met 12 5.000 2.941<br />

N = Asn 7 2.917 0.678<br />

O = --- 0 0.000 0.000<br />

P = Pro 10 4.167 0.801<br />

Q = Gln 4 1.667 0.427<br />

R = Arg 6 2.500 0.510<br />

S = Ser 13 5.417 0.774<br />

T = Thr 16 6.667 1.093<br />

U = --- 0 0.000 0.000<br />

V = Val 19 7.917 1.199<br />

W = Trp 0 0.000 0.000<br />

X = Xaa 0 0.000 0.000<br />

Y = Tyr 6 2.500 0.735<br />

Z = Glx 0 0.000 0.000<br />

www.themegallery.com


Property Residues Number Mole%<br />

Tiny (A+C+G+S+T) 64 26.667<br />

Small (A+B+C+D+G+N+P+S+T+V) 119 49.583<br />

Aliphatic (A+I+L+V) 70 29.167<br />

Aromatic (F+H+W+Y) 12 5.000<br />

Non-polar (A+C+F+G+I+L+M+P+V+W+Y) 125 52.083<br />

Polar (D+E+H+K+N+Q+R+S+T+Z) 115 47.917<br />

Charged (B+D+E+H+K+R+Z) 75 31.250<br />

Basic (H+K+R) 36 15.000<br />

Acidic (B+D+E+Z) 39 16.250<br />

该 酶 的 等 电 点 为 5.0902, 含 有 的 极 性 氨<br />

基 酸 占 47.917%, 非 极 性 占 52.083%,<br />

带 电 的 氨 基 酸 有 75 个 , 占 31.250%, 总 带<br />

的 电 荷 量 为 -3.5。<br />

www.themegallery.com


2、 用 ExPASy 中 protscale 对 该 酶 进 行<br />

疏 水 性 和 亲 水 性 分 析<br />

图 中 以 0 为 界 , 正 值 表 示 疏 水 , 负 值 表 示 亲 水 。<br />

www.themegallery.com


3、 用 ExPASy 中 TMHMM 分 析 跨 膜 螺 旋<br />

由 上 图 可 以 看 出 , 该 蛋 白 质 无 跨 膜 区 , 蛋 白 全 部 在 膜 外 。 曲<br />

线 的 纵 坐 标 是 概 率 , 横 坐 标 是 序 列 , 一 共 240 个 氨 基 酸 , 红<br />

色 表 示 跨 膜 区 , 几 乎 都 在 5% 概 率 下 , 蓝 色 inside 即 在 膜 内 部<br />

, 概 率 极 低 ; 相 反 紫 色 细 线 表 示 在 膜 外 的 概 率 有 85%。 因 此 1<br />

到 240 位 氨 基 酸 全 部 是 outside。<br />

www.themegallery.com


4、 用 CBS 中 signal 对 该 酶 进 行 信 号 肽 分 析<br />

图 中 可 见 ,C 、S、Y 三 项 得 分 均 较 低 , 因 此 该 蛋 白 不 含 信 号 肽<br />

www.themegallery.com


5、 用 CBS 中 targetP 对 该 酶 进 行 亚 细 胞 定 位<br />

loc 中 显 示 的 是 “-” 表 示 该 蛋 白 在 任 何 位 置 都 有 存 在 。<br />

www.themegallery.com


6、 通 过 ExPASy 中 SOPMA 对 该 酶 二 级 结 构 进<br />

行 预 测<br />

由 图 中 可 以 看 出 该 酶 中 的 二 级 结 构 主 要 有 α 螺 旋 (40.42%),<br />

无 规 则 卷 曲 (30.83%) 和 β 折 叠 (7.08%)。<br />

www.themegallery.com


www.themegallery.com

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!