genômica comparativa e algorítmos de clusterização para ... - UFMG

genômica comparativa e algorítmos de clusterização para ... - UFMG genômica comparativa e algorítmos de clusterização para ... - UFMG

homepages.dcc.ufmg.br
from homepages.dcc.ufmg.br More from this publisher

Mateus Edson <strong>de</strong> Oliveira Carvalho<br />

mateusc@dcc.ufmg.br<br />

Orientador: Pr. Marcos Augusto dos Santos<br />

Co-Orientador: Lorena Rivarola Duarte


• Chamamos <strong>de</strong> FILOGENIA as hipóteses <strong>de</strong> relações<br />

evolutivas <strong>de</strong> um grupo <strong>de</strong> organismos<br />

• GENOMA é toda a informação hereditária codificada no<br />

DNA <strong>de</strong> um organismo<br />

• Devido a gran<strong>de</strong> quantida<strong>de</strong> <strong>de</strong> informação contida em<br />

genomas, é comum se utilizar abordagens computacionais<br />

<strong>para</strong> automatizar o estudo genomico


•Desenvolvemos um algorítmo <strong>de</strong> <strong>clusterização</strong> que<br />

realizou com sucesso a filogenia <strong>de</strong> grupos <strong>de</strong> organismos


• Analisamos os aminoácidos presentes nas<br />

proteínas dos genomas das plantas e bactérias<br />

• Proteoma Completo<br />

• Ambiente escolhido: MATLAB


Resultados<br />

obtidos<br />

através da<br />

aplicação do<br />

algoritmo <strong>de</strong><br />

<strong>clusterização</strong><br />

<strong>para</strong><br />

bactérias.


Resultados<br />

obtidos<br />

através da<br />

aplicação do<br />

algoritmo <strong>de</strong><br />

<strong>clusterização</strong><br />

<strong>para</strong><br />

bactérias.


• DOIS SÃO OS OBJETIVOS PRINCIPAIS<br />

• Revisão bibliográfica <strong>de</strong>talhada<br />

• Análise <strong>de</strong> estudos similares ao nosso e com<strong>para</strong>ção dos<br />

métodos e entradas utilizadas<br />

• Aplicação do nosso algoritmo em entrada selecionadas:<br />

• Análise dos resultados com<br />

Proteomas Completos x Proteomas Incompletos


B.R.G.M Couto (2007) utilizou duas bases <strong>de</strong> dados<br />

<strong>para</strong> a análise proteíca utilizando SVD:<br />

• Uma com 832 proteínas presentes em 13 famílias<br />

<strong>de</strong> genes mitocondriais<br />

• Outra composta por 1000 sequências <strong>de</strong> 9<br />

diferentes tipos <strong>de</strong> proteínas armazenas do<br />

sistema GenBank


• (FITZPATRICK et al., 2006) realizou uma aplicação com<br />

42 tipos <strong>de</strong> fungos dos Filos Ascomycota, Basidiomycota e<br />

Zugomycota.<br />

• O trabalho (FITZPATRICK et al., 2006) foi bem <strong>de</strong>talhado<br />

e <strong>de</strong>scrito, o que nos levou a utilizar <strong>de</strong> sua entrada <strong>para</strong><br />

nosso método


Visualização<br />

em<br />

2 dimensões


Visualização<br />

em<br />

3 dimensões


• Foram utilizados 8 outliers <strong>para</strong> esse estudo<br />

• Percebemos que 7 <strong>de</strong>sses foram colocados no mesmo<br />

grupo:<br />

Mesmo Cluster Cluster Distinto<br />

Ccine Umay<br />

CneoB Lthermo<br />

CneoJ Sjapo<br />

Lbico<br />

Mglobo<br />

Mperni<br />

Pplacen


• Proteoma Completo x Seleção <strong>de</strong> partes do Proteoma<br />

• Grupo das Bactérias<br />

• 50 % do proteoma completo<br />

• 25 % do proteoma completo<br />

• 10 % do proteoma completo


# <strong>de</strong> Clusters # <strong>de</strong> mudanças entre<br />

espécies<br />

PROTEOMA COMPLETO 3 ou 4 -<br />

50% DO PROTEOMA 3 3<br />

25 % DO PROTEOMA 3 5


[FIT 06] FITZPATRICK, D. A. et al. A fungal phylogeny based on 42<br />

complete genomes <strong>de</strong>rived from supertree and combined gene<br />

analysis. BMC Evolutionary Biology, [S.l.], v.6, n.99, 2006.<br />

[JON 04] JONES, N. C.; PEVZNER, P. A. An introduction to<br />

bioinformatics algorithms. Massachusetts. Institute of Technology,<br />

2004.<br />

[LOB 09] LOBO, F. P. et al. Virus-host coevolution: Common patterns<br />

of nucleoti<strong>de</strong> motif usage in flaviviridae and their hosts. PLoS ONE,<br />

[S.l.], v.4, n.7, 2009.<br />

[STU 03] STUART, G. W.; BERRY, M. W. A comprehensive whole<br />

genome bacterial phylogeny usingcorrelated pepti<strong>de</strong> motifs <strong>de</strong>fined<br />

in a high dimensional vector space. Journal of Bioinformatics and<br />

Computational Biology, [S.l.], v.4, 2003.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!