Sabiia Seb
PortuguêsEspañolEnglish
Embrapa
        Busca avançada

Botão Atualizar


Botão Atualizar

Ordenar por: RelevânciaAutorTítuloAnoImprime registros no formato resumido
Registros recuperados: 1
Primeira ... 1 ... Última
Imagem não selecionada

Imprime registro no formato completo
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. Infoteca-e
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O..
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados...
Tipo: Boletim de Pesquisa e Desenvolvimento (INFOTECA-E) Palavras-chave: Recuperação da informação; Seleção de atributos; N-gramas; Atributos redundantes; Mineração de textos; Dados categorizados; Attribute selection; Information retrieval; N-grams; Redundant attribute; Text mining; Categorical data.
Ano: 2010 URL: http://www.infoteca.cnptia.embrapa.br/handle/doc/885611
Registros recuperados: 1
Primeira ... 1 ... Última
 

Empresa Brasileira de Pesquisa Agropecuária - Embrapa
Todos os direitos reservados, conforme Lei n° 9.610
Política de Privacidade
Área restrita

Embrapa
Parque Estação Biológica - PqEB s/n°
Brasília, DF - Brasil - CEP 70770-901
Fone: (61) 3448-4433 - Fax: (61) 3448-4890 / 3448-4891 SAC: https://www.embrapa.br/fale-conosco

Valid HTML 4.01 Transitional