Foram sete meses de trabalho para “ensinar” o computador a interpretar textos. A fakenewsbr.com é uma plataforma de verificação que identifica informações falsas de forma automática. O coordenador do projeto, professor Francisco Louzada, do Centro de Matemática e Estatística Aplicada a Indústria (CeMEAI), explica que o sistema usa algoritmos de inteligência artificial para identificar padrões comuns em notícias mentirosas. “Identificamos palavras, expressões e estruturas comuns em notícias falsas. O texto mentiroso costuma apelar para a emoção do leitor, é opinativo e carrega um tom de urgência. Esses padrões, junto com algumas palavras que costumam sempre aparecer em textos enganosos, são os sinais que o computador localiza e classifica”, detalha.
A ferramenta ainda funciona de forma experimental, mas já pode ser consultada por qualquer pessoa pelo endereço fakenewsbr.com. Em menos de um mês vai estar pronta para a operação definitiva. “Há uma expectativa de que as eleições deste ano sejam marcadas por muitas mentiras na internet. Essa ferramenta pode ajudar o brasileiro a separar as verdades das mentiras antes de tomar sua decisão”, acredita Louzada.
A inovação foi apresentada a peritos criminais de todo o Brasil durante o XXVI Congresso Nacional de Criminalística, realizado pelo Sindicato dos Peritos Criminais do Estado de São Paulo (SINPCRESP).
O professor explica que o sistema consegue ‘entender’ a informação, para identificar mentiras mesmo que o texto apareça reescrito ou editado em sites diferentes. “Mesmo os sites campeões de fake news publicam cerca de 60% de conteúdo verdadeiro, como forma de confundir o leitor. O algoritmo analisa o texto completo e identifica as informações principais. Isso permite encontrar mentiras em qualquer notícia, mesmo quando essa fraude aparece em um pequeno trecho do texto”, explica Louzada.
Para treinar a inteligência artificial, os pesquisadores alimentaram o banco de dados com mais de 7 mil notícias já verificadas e classificadas entre verdadeiras e falsas. Depois foram selecionadas outras 99 mil notícias para a verificação. Essa segunda etapa foi uma espécie de “treino” para a máquina. O resultado foi de 96% de acerto, em média.
Ataques de hackers
Francisco Louzada conta que o site passou a ser alvo de ataques de hackers, que tentaram sobrecarregar o servidor com milhares de consultas simultâneas, feitas por robôs. Houve lentidão, mas os invasores não conseguiram atingir o objetivo de deixar o sistema fora do ar. “A plataforma foi hospedada em um servidor mais robusto e seguro para enfrentar o período eleitoral, ele deve ter grande demanda”, revela.
Redes sociais
O fakenewsbr foi desenvolvido para analisar notícias completas. A equipe de cientistas e desenvolvedores agora trabalha na análise de textos curtos, de publicações em redes sociais. “O texto mais longo traz uma informação completa, mas posts de redes sociais, além de curtos, podem ter palavras abreviadas. Também encontramos postagens com textos completamente verdadeiros, mas que indicam links para notícias falsas. Em alguns meses essa verificação também estará disponível”, completa o especialista.