11.07.2015 Views

Untitled - UFRJ

Untitled - UFRJ

Untitled - UFRJ

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Aplicação e Validação do Método de Agrupamento HierárquicoBayesianoJuliana Garcia CespedesCarlos H. SilveiraIsabela N. DrummondAdriana P. MattediDepto de Matemática e Computação - UNIFEIValdetti M. G. AlmeidaMarcelo M. SantoroDepto de Bioquímica-Imunologia - UFMGWagner Meira JuniorDepto de Ciência da Computação - UFMGAgrupamento de dados reúne técnicas usadas basicamente para encontrar grupos em um conjuntode dados que compartilham certas características em comum, formando aglomerados de entidades maishomogêneos. Pode-se estabelecer previamente o número de grupos a ser formado, ou então permitirao algoritmo de agrupamento uma livre associação de unidades, de forma que a quantidade de gruposresultante seja conhecida somente ao final do processo. Existe uma grande quantidade de métodos deagrupamento probabilísticos encontrados na literatura, entre eles o método de agrupamento hierárquicoBayesiano, que basicamente ordena os dados numa hierarquia de grupos, procurando a maximização daprobabilidade a posteriori de cada agrupamento, levando em consideração o conhecimento a priori donúmero e/ou algumas características gerais das classes que podem facilitar a categorização dos dados.A forma de combinar o conhecimento a priori com a informação contida nos dados dá-se atravésda utilização da inferência Bayesiana. A proposta deste trabalho é avaliar o método de agrupamentohierárquico Bayesiano para agrupar um conjunto de proteínas complexadas com ligantes proteicos, divididosem 3 classes: subtilases conjugadas a inibidores proteicos; serino-proteases-não-subtilases conjugadasa inibidores proteicos; e outros complexos proteínas-ligantes, envolvendo não serino-proteases, como metaloproteases,transferases, imunoglobulinas etc. Trata-se de uma base de dados que foi cuidadosamenteanotada e classificada por humanos, constituindo-se numa massa de dados ideal para a validação demétodos de classificação e agrupamento. Porém, ela apresenta alguns desafios intrínsecos. É sabidoque, em algumas subtilases e serino-proteases-não-subtilases, pode ocorrer inibição cruzada, indicandoque essas diferentes proteases compartilham algumas características físico-químicas comuns em suas interfacescom ligantes. Os resultados aqui reportados mostram que essas propriedades da interface têmpoder discriminatório entre as proteases, de forma que os agrupamentos tendem a aglutinar instâncias deuma mesma classe. No entanto, algumas instâncias de serino-proteases-não-subtilases foram agregadasao agrupamento das subtilases, sugerindo compartilhamento de propriedades comuns, conforme requera inibição cruzada. Logo, conclui-se preliminarmente que o agrupamento hierárquico Bayesiano passoupelo crivo da validação semântica, sendo capaz de gerar resultados coerentes e sugestivos na análisecomparativa de complexos proteicos.69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!