Text Categorization Tool API: classificação automática de textos e apoio à decisão

 

 

Introdução

A evolução da internet e das redes sociais aumentou muito significativamente o fluxo de informações em todo o mundo. Considerando a influência que a escrita tem na sociedade é imprescindível que tais informações sejam avaliadas e estudadas.

 

A análise de fatos relevantes, e de sua repercussão na sociedade, pode ser realizada por meio de um programa de computador, o que possibilita um rápido conhecimento das informações e a oportunidade de resposta ou providência imediata.

 

Objetivos

O software Text Categorization Tool API provê uma interface fácil para (i) gerar modelos de classificação automática de textos e (i) classificar novos textos rapidamente, por meio de algoritmos de aprendizado de máquina supervisionado e semissupervisionado.

Quando comparado às alternativas disponíveis para classificação automática de textos, destacam-se as seguintes características:

• Os algoritmos de aprendizado de máquina, tanto supervisionado quanto semissupervisionado, desenvolvidos e inseridos na API, propostos apresentaram resultados superiores aos do estado da arte nos testes realizados;

• O software pode realizar a classificação automática de textos escritos em qualquer língua. Os algoritmos contidos no software foram amplamente testados e analisados em textos escritos em inglês e em português;

• Pode ser integrado a qualquer outro software existente. O usuário pode utilizar diretamente o software como uma biblioteca ou chamar o software por meio de linha de comando.

 

Aplicações

Os testes foram realizados em 45 coleções de textos, as quais possuem diferentes características e advêm de diferentes domínios, como médicos, científicos, páginas web e coleções de análise de sentimentos.

Nos testes foram aplicados procedimentos e obtidas métricas de avaliação de acordo com os rigores científicos da área.

Exemplos de utilização: (i) análise de sentimentos em publicações feitas em redes sociais, (ii) impacto do lançamento de campanhas e novos produtos, (iii) medição da repercussão de declarações e notícias políticas e de atos do governo; (iv) organização de documentos.

 

Público alvo: Instituições que desejem utilizar o software para análise de informações de seu próprio interesse ou que prestem a terceiros o serviço de obtenção e análise de informações para apoio à decisão.

 

Estágio de desenvolvimento
 

 

Registro de Software sob n° BR512016001016-9

Informação sobre a PI:
Para mais informações, entre em contato:
Eduardo Vieira De Brito
ADMINISTRADOR
Universidade de São Paulo
55 16 3373 8052
eduardobrito@usp.br
Inventores:
Solange Oliveira Rezende
Rafael Geraldeli Rossi
Palavras-chave:
Apoio à Decisão
Aprendizado de Máquina
Aprendizado Semi-Supervisionado
Aprendizado Supervisionado
Redes Heterogêneas
© 2019. All Rights Reserved. Powered by Inteum