Você está aqui: Página Inicial > Notícias > Toledo > PESQUISA
conteúdo

Notícias

PESQUISA

Professor de TSI esteve na Alemanha para desenvolver parte de sua pesquisa de doutorado e publica artigo em conceituada revista científica
publicado: 25/11/2019 14h44 última modificação: 25/11/2019 15h58
Eduardo Pena

Eduardo Pena

O professor do curso de Tecnologia em Sistemas para Internet, Eduardo Pena, esteve no ano de 2018 no Instituto Hasso Plattner Institut, em Potsdam, na Alemanha, desenvolvendo parte de seu doutorado.

Esse estudo resultou em um artigo denominado Discovery of Approximate (and Exact) Denial Constraints, que foi desenvolvido juntamente com os pesquisadores Eduardo C. de Almeira (UFPR) e Felix Naumann Hasso Plattner (Institute University of Potsdam - Alemanha), e publicado na PVLDB (Proceedings of the VLDB Endowment).

O artigo trata de abordagens recentes para limpeza de dados relacionais, as quais se baseiam em restrições de integridade.

O 'Estado da Arte' em limpeza de dados tem utilizado o formalismo de restrição de negação (RN) para lidar com uma ampla gama de restrições do mundo real. Cada RN expressa um relacionamento entre predicados que indica combinações de valores inconsistentes, mas a especificação de RNs deve acompanhar a complexidade dos dados e aplicação.

Em alternativa à especificação manual de RNs temos a descoberta automática de RNs a partir de conjunto de dados; tarefa computacionalmente cara, uma vez que o espaço de busca de RNs é gigantesco.

Para lidar com o problema, apresentamos um novo algoritmo para descoberta automática de RNs, DCFinder. Assim, o algoritmo combina estrutura de dados chamadas lista de índices de posição com técnicas baseadas na seletividade de predicado para validar RNs candidatas de forma eficiente.

Uma vez que dados reais geralmente contêm erros, DCFinder é desenvolvido para adicionalmente descobrir RNs aproximadas, i.e., RNs que podem se manter parcialmente.

A análise do docente, juntamente com os demais pesquisadores, usa um conjunto de dados reais e sintéticos e mostra que o algoritmo DCFinder supera todos os algoritmos de descoberta de RNs aproximadas.