genômica comparativa e algorítmos de clusterização para ... - UFMG
genômica comparativa e algorítmos de clusterização para ... - UFMG genômica comparativa e algorítmos de clusterização para ... - UFMG
Mateus Edson de Oliveira Carvalho mateusc@dcc.ufmg.br Orientador: Pr. Marcos Augusto dos Santos Co-Orientador: Lorena Rivarola Duarte
- Page 2 and 3: • Chamamos de FILOGENIA as hipót
- Page 4 and 5: • Analisamos os aminoácidos pres
- Page 6 and 7: Resultados obtidos através da apli
- Page 8 and 9: B.R.G.M Couto (2007) utilizou duas
- Page 10 and 11: Visualização em 2 dimensões
- Page 12 and 13: • Foram utilizados 8 outliers par
- Page 14 and 15: # de Clusters # de mudanças entre
Mateus Edson <strong>de</strong> Oliveira Carvalho<br />
mateusc@dcc.ufmg.br<br />
Orientador: Pr. Marcos Augusto dos Santos<br />
Co-Orientador: Lorena Rivarola Duarte
• Chamamos <strong>de</strong> FILOGENIA as hipóteses <strong>de</strong> relações<br />
evolutivas <strong>de</strong> um grupo <strong>de</strong> organismos<br />
• GENOMA é toda a informação hereditária codificada no<br />
DNA <strong>de</strong> um organismo<br />
• Devido a gran<strong>de</strong> quantida<strong>de</strong> <strong>de</strong> informação contida em<br />
genomas, é comum se utilizar abordagens computacionais<br />
<strong>para</strong> automatizar o estudo genomico
•Desenvolvemos um algorítmo <strong>de</strong> <strong>clusterização</strong> que<br />
realizou com sucesso a filogenia <strong>de</strong> grupos <strong>de</strong> organismos
• Analisamos os aminoácidos presentes nas<br />
proteínas dos genomas das plantas e bactérias<br />
• Proteoma Completo<br />
• Ambiente escolhido: MATLAB
Resultados<br />
obtidos<br />
através da<br />
aplicação do<br />
algoritmo <strong>de</strong><br />
<strong>clusterização</strong><br />
<strong>para</strong><br />
bactérias.
Resultados<br />
obtidos<br />
através da<br />
aplicação do<br />
algoritmo <strong>de</strong><br />
<strong>clusterização</strong><br />
<strong>para</strong><br />
bactérias.
• DOIS SÃO OS OBJETIVOS PRINCIPAIS<br />
• Revisão bibliográfica <strong>de</strong>talhada<br />
• Análise <strong>de</strong> estudos similares ao nosso e com<strong>para</strong>ção dos<br />
métodos e entradas utilizadas<br />
• Aplicação do nosso algoritmo em entrada selecionadas:<br />
• Análise dos resultados com<br />
Proteomas Completos x Proteomas Incompletos
B.R.G.M Couto (2007) utilizou duas bases <strong>de</strong> dados<br />
<strong>para</strong> a análise proteíca utilizando SVD:<br />
• Uma com 832 proteínas presentes em 13 famílias<br />
<strong>de</strong> genes mitocondriais<br />
• Outra composta por 1000 sequências <strong>de</strong> 9<br />
diferentes tipos <strong>de</strong> proteínas armazenas do<br />
sistema GenBank
• (FITZPATRICK et al., 2006) realizou uma aplicação com<br />
42 tipos <strong>de</strong> fungos dos Filos Ascomycota, Basidiomycota e<br />
Zugomycota.<br />
• O trabalho (FITZPATRICK et al., 2006) foi bem <strong>de</strong>talhado<br />
e <strong>de</strong>scrito, o que nos levou a utilizar <strong>de</strong> sua entrada <strong>para</strong><br />
nosso método
Visualização<br />
em<br />
2 dimensões
Visualização<br />
em<br />
3 dimensões
• Foram utilizados 8 outliers <strong>para</strong> esse estudo<br />
• Percebemos que 7 <strong>de</strong>sses foram colocados no mesmo<br />
grupo:<br />
Mesmo Cluster Cluster Distinto<br />
Ccine Umay<br />
CneoB Lthermo<br />
CneoJ Sjapo<br />
Lbico<br />
Mglobo<br />
Mperni<br />
Pplacen
• Proteoma Completo x Seleção <strong>de</strong> partes do Proteoma<br />
• Grupo das Bactérias<br />
• 50 % do proteoma completo<br />
• 25 % do proteoma completo<br />
• 10 % do proteoma completo
# <strong>de</strong> Clusters # <strong>de</strong> mudanças entre<br />
espécies<br />
PROTEOMA COMPLETO 3 ou 4 -<br />
50% DO PROTEOMA 3 3<br />
25 % DO PROTEOMA 3 5
[FIT 06] FITZPATRICK, D. A. et al. A fungal phylogeny based on 42<br />
complete genomes <strong>de</strong>rived from supertree and combined gene<br />
analysis. BMC Evolutionary Biology, [S.l.], v.6, n.99, 2006.<br />
[JON 04] JONES, N. C.; PEVZNER, P. A. An introduction to<br />
bioinformatics algorithms. Massachusetts. Institute of Technology,<br />
2004.<br />
[LOB 09] LOBO, F. P. et al. Virus-host coevolution: Common patterns<br />
of nucleoti<strong>de</strong> motif usage in flaviviridae and their hosts. PLoS ONE,<br />
[S.l.], v.4, n.7, 2009.<br />
[STU 03] STUART, G. W.; BERRY, M. W. A comprehensive whole<br />
genome bacterial phylogeny usingcorrelated pepti<strong>de</strong> motifs <strong>de</strong>fined<br />
in a high dimensional vector space. Journal of Bioinformatics and<br />
Computational Biology, [S.l.], v.4, 2003.