Introdução
A evolução da internet e das redes sociais aumentou muito significativamente o fluxo de informações em todo o mundo. Considerando a influência que a escrita tem na sociedade é imprescindível que tais informações sejam avaliadas e estudadas.
A análise de fatos relevantes, e de sua repercussão na sociedade, pode ser realizada por meio de um programa de computador, o que possibilita um rápido conhecimento das informações e a oportunidade de resposta ou providência imediata.
Objetivos
O software Text Categorization Tool API provê uma interface fácil para (i) gerar modelos de classificação automática de textos e (i) classificar novos textos rapidamente, por meio de algoritmos de aprendizado de máquina supervisionado e semissupervisionado.
Quando comparado às alternativas disponíveis para classificação automática de textos, destacam-se as seguintes características:
• Os algoritmos de aprendizado de máquina, tanto supervisionado quanto semissupervisionado, desenvolvidos e inseridos na API, propostos apresentaram resultados superiores aos do estado da arte nos testes realizados;
• O software pode realizar a classificação automática de textos escritos em qualquer língua. Os algoritmos contidos no software foram amplamente testados e analisados em textos escritos em inglês e em português;
• Pode ser integrado a qualquer outro software existente. O usuário pode utilizar diretamente o software como uma biblioteca ou chamar o software por meio de linha de comando.
Aplicações
Os testes foram realizados em 45 coleções de textos, as quais possuem diferentes características e advêm de diferentes domínios, como médicos, científicos, páginas web e coleções de análise de sentimentos.
Nos testes foram aplicados procedimentos e obtidas métricas de avaliação de acordo com os rigores científicos da área.
Exemplos de utilização: (i) análise de sentimentos em publicações feitas em redes sociais, (ii) impacto do lançamento de campanhas e novos produtos, (iii) medição da repercussão de declarações e notícias políticas e de atos do governo; (iv) organização de documentos.
Público alvo: Instituições que desejem utilizar o software para análise de informações de seu próprio interesse ou que prestem a terceiros o serviço de obtenção e análise de informações para apoio à decisão.
Estágio de desenvolvimento
Registro de Software sob n° BR512016001016-9