CISUC

Inductive Inference for Large Scale Text Classification

Authors

Abstract

O tema principal desta Tese é a categorização automática de textos, ou seja, a atribuição de categorias predefinidas (ou não) a qualquer tipo de texto em formato digital armazenado em bases de dados ou via Web. Com o aumento do volume de informação digital disponível nos mais variados domínios (internet, imprensa, medicina etc.) aumenta a necessidade de desenvolvimento de sistemas que permitam uma melhor organização e utilização desses recursos. As soluções baseadas em algoritmos de aprendizagem que têm sido propostas não têm abordado questões de escalabilidade que surgem devido à complexidade crescente do processamento de milhões de documentos. Para além disso, não tem sido dado ênfase quer ao custo elevado da categorização, quer a ambientes dinâmicos de utilização. Estes factores conjugados levam à procura de novas soluções baseadas em máquinas de vectores de suporte (SVMs) e de vectores relevantes (RVM) caracterizadas pelo seu elevado desempenho na predição de categorias bem como a possibilidade de utilização de um ambiente de processamento distribuído e capacidade de responder a diferentes dinâmicas em tempo real..

Subject

Text mining; RVM; SVM

PhD Thesis

Inductive Inference for Large Scale Text Classification, March 2009

Cited by

No citations found