Uso de crowdsourcing para criação de corpus para detecção de plágio em textos de língua portuguesa

Descrição do Projeto

O excesso de informação disponível na WEB ao mesmo tempo que permite o fácil acesso também estimula o seu plágio por usuários maliciosos ou preguiçosos.

O desenvolvimento de tecnologias para a detecção de plágio normalmente fazem uso de corpus para testes e validação de algoritmos. No entanto, a grande maioria desses corpus são construídos a partir de documentos em inglês.

Em um cenário futuro onde o plágio deverá crescer a ponto de artigos científicos serem produzidos sem autores, apenas por computadores, desenvolver algoritmos de detecção de plágio em diversos idiomas torna-se urgente.

Este projeto de pesquisa esta sendo desenvolvido em colaboração com a Universidade Federal Rural do Rio de Janeiro.

Linha de Pesquisa

Futuro da Ciência

Pesquisadores

Fellipe Duarte
Gilda Esteves
Patrícia Wang
Vanessa Soares
Jano Moreira de Souza
Geraldo Xexéo