Você está aqui: Página Inicial > Defesas > Dissertação de Mestrado - Eric Augusto Ito
conteúdo

Dissertação de Mestrado - Eric Augusto Ito

por jesimao publicado 15/10/2020 13h40, última modificação 19/10/2020 09h52
Plawss: Power Law Semantic Similarity Metodologia Data-Driven Baseada Em Lei De Potência Para O Cálculo De Similaridade Semântica Go
Quando
21/10/2020
de 14h00 até 17h00
(America/Sao_Paulo / UTC-200)
Onde
Sala de Web Conferência
Pessoa de contato
Participantes
Prof. Dr. Fabrício Martins Lopes (Presidente) PPGBIOINFO-UTFPR/CP
Prof. Dr. Mauro Antonio Alves Castro – UFPR/CT
Prof. Dr. Fábio Fernandes da Rocha Vicente – UTFPR-CP
Site
Visite o site do evento
Adicionar evento ao calendário
iCal

Resumo:

Genes são amplamente estudados pela comunidade científica devido a sua importância em diversas pesquisas, muitas delas relacionadas a saúde. Por conta disto, muitos métodos foram desenvolvidos para calcular a Similaridade Semântica (SS) entre genes. A Similaridade semântica tem sido usado em várias pesquisas como inferência e validação de redes, dobramento de proteínas, entre outras. Inicialmente proposto por Wang el al. (WANG et al., 2007) e que foi incrementado na ferramenta GOGO (ZHAO; WANG, 2018), a metodologia apresentada por Wang e GOGO não se limita a usar Information content (IC) para calcular a similaridade semântica. Wang propôs um método híbrido que calcula a similaridade a partir da topologia do grafo acíclico direcionado GO. GOGO por sua vez propôs usar o número de termos filhos como substituto de IC, visto que o GOGO notou a correlação inversa entre IC e o número de termos filho, dessa forma mesmo sem usar o IC, GOGO consegue ter as vantagens de métodos baseados em IC junto com o método híbrido de Wang. Porém o GOGO propõe um método que depende de variáveis que não se ajustam aos dados de ontologias, por outro o Wang se limita a pesar os termos GO somente dependendo do tipo de ligação entre os termos GO. Este trabalho apresenta um novo método para o cálculo da similaridade semântica em genes utilizando um modelo híbrido para calcular a similaridade semântica utilizando a Ontologia Gênica, o qual é data-driven se adaptando aos dados de ontologia utilizando lei de potência para pesar cada termo GO, e que em adição ao tipo de ligação, neste trabalho também é levado em consideração o número de filhos do ancestral para identificar a especificidade do termo GO. Seis conjuntos de dados compostos por vias metabólicas foram clusterizados utilizando as similaridades semânticas calculadas entre cada par de gene, os clusters formados a partir das funções moleculares e processos biológicos apresentaram os melhores resultados, sendo eles, 83,33% e 66,67% respectivamente, corroborando para a provação do método proposto.