11.07.2015 Views

Untitled - UFRJ

Untitled - UFRJ

Untitled - UFRJ

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Estudos Comparativos Envolvendo Classificação Bayesiana emDados ProteicosIsabela Neves DrummondJuliana Garcia CespedesCarlos H. SilveiraAdriana P. MattediDepto de Matemática e Computação - UNIFEIValdetti M. G. AlmeidaMarcelo M. SantoroDepto de Bioquímica-Imunologia - UFMGWagner Meira JuniorDepto de Ciência da Computação - UFMGReconhecimento de padrões é a área de pesquisa que tem por objetivo a classificação de objetos(padrões) em um número de categorias ou classes. As técnicas de reconhecimento de padrões podem seraplicadas em bioinformática, análise de seqüências de proteínas ou DNA, mineração de dados (data mining),classificação de documentos, análise de imagens etc. Basicamente, um processo de reconhecimentoestatístico de padrões é composto por 3 etapas: pré-processamento, para eliminar ruídos ou distorções;extração de características, que cria um vetor de características com dados extraídos dos objetos adquiridos;e um classificador, que analisa um padrão obtido e toma uma certa decisão. O classificador tomadecisões baseando-se no aprendizado obtido a partir de um conjunto de treinamento, o qual contém exemplosde padrões de todas as classes existentes no sistema. Existes muitos tipos de classificadores queutilizam a inferência Bayesiana, entre eles o classificador de Bayes (Naive Bayes) e as Redes Bayesianas.Neste trabalho pretende-se comparar a classificação obtida pelos dois métodos utilizando um conjunto dedados de proteínas complexadas com ligantes proteicos, divididos em 3 classes: subtilases conjugadas ainibidores proteicos; serino-proteases-não-subtilases conjugadas a inibidores proteicos; e outros complexosproteínas-ligantes, envolvendo não serino-proteases, como metaloproteases, transferases, imunoglobulinasetc. Trata-se de uma base de dados que foi cuidadosamente anotada e classificada por humanos,constituindo-se numa massa de dados ideal para a validação de métodos de classificação e agrupamento.Os resultados aqui reportados mostram que os classificadores Bayesianos utilizados tiveram um desempenhoaquém das expectativas da validação semântica. Não só geraram estatísticas de acerto inferioresaos obtidos com o método de agrupamento hierárquico Bayesiano, aplicados à mesma base, como tambémpermitiram movimentações de instâncias entre as classes não de todo coerentes com o esperado do pontode vista do atual entendimento bioquímico do fenômeno da complexão entre proteases e seus inibidores.A limitação pode estar não nos métodos em si, mas em suas implementações e parametrizações. Umestudo mais aprofundado está em andamento, no sentido de verificar essa hipótese.79

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!