Treinamento de um modelo random forest em R a partir de links de notícias verdadeiras e falsas. O modelo é base para uma API hospedada em https://www.opencpu.org/cloud.html que recebe links (URLs) de notícias e retorna como resposta se a notícia provavelmente é verdadeira ou falsa.
A proliferação desenfreada de notícias falsas e os problemas sociais que ela acarreta, em especial em relação à saúde pública dado o cenário atual, inspiraram uma série de iniciativas. Entre elas estão o link [Health Buddy], um chatbot desenvolvido pela Unicef que responde dúvidas comuns e aceita denúncias de notícias falsas, o canal de mensagens Saúde sem Fake News desenvolvido pelo Ministério da Saúde e o aplicativo Eu Fiscalizo, da Fiocruz, que aceita denúncias de notícias falsas.
Utilizamos como base o trabalho Towards automatically filtering fake news in Portuguese, por Renato M. Silva, Roney L. S. Santos, Tiago A. Almeida, Thiago A. S. Pardo link para treinar um modelo de Machine Learning, com dados do fake.br Corpus link.