Inductive Inference for Large Scale Text Classification
Authors
Abstract
O tema principal desta Tese é a categorização automática de textos, ou seja, a atribuição de categorias predefinidas (ou não) a qualquer tipo de texto em formato digital armazenado em bases de dados ou via Web. Com o aumento do volume de informação digital disponível nos mais variados domínios (internet, imprensa, medicina etc.) aumenta a necessidade de desenvolvimento de sistemas que permitam uma melhor organização e utilização desses recursos. As soluções baseadas em algoritmos de aprendizagem que têm sido propostas não têm abordado questões de escalabilidade que surgem devido à complexidade crescente do processamento de milhões de documentos. Para além disso, não tem sido dado ênfase quer ao custo elevado da categorização, quer a ambientes dinâmicos de utilização. Estes factores conjugados levam à procura de novas soluções baseadas em máquinas de vectores de suporte (SVMs) e de vectores relevantes (RVM) caracterizadas pelo seu elevado desempenho na predição de categorias bem como a possibilidade de utilização de um ambiente de processamento distribuído e capacidade de responder a diferentes dinâmicas em tempo real..
Subject
Text mining; RVM; SVM
PhD Thesis
Inductive Inference for Large Scale Text Classification, March 2009
Cited by
No citations found