Sabiia Seb
PortuguêsEspañolEnglish
Embrapa
        Busca avançada

Botão Atualizar


Botão Atualizar

Ordenar por: RelevânciaAutorTítuloAnoImprime registros no formato resumido
Registros recuperados: 4
Primeira ... 1 ... Última
Imagem não selecionada

Imprime registro no formato completo
A proposal for building domain topic taxonomies. Repositório Alice
MOURA, M. F.; MARCACINI, R. M.; NOGUEIRA, B. M.; CONRADO, M. da S.; REZENDE, S. O..
In this work a methodology to aid the process of organizing text collections is proposed, aiming to reflect exactly the existent and recoverable publications in a specific domain.
Tipo: Resumo em anais de congresso (ALICE) Palavras-chave: Mineração de dados e textos; Data mining; Text mining; Taxonomia; Análise multivariada; Taxonomy; Multivariate analysis.
Ano: 2008 URL: http://www.alice.cnptia.embrapa.br/handle/doc/9618
Imagem não selecionada

Imprime registro no formato completo
Facilitando a avaliação de taxonomias de tópicos automaticamente geradas no domínio do agronegócio. Repositório Alice
CONRADO, M. da S.; MOURA, M. F.; REZENDE, S. O..
O custo de avaliação de taxonomias automaticamente geradas costuma ser alto se realizado exclusivamente por especialistas do domínio. Neste trabalho propõe-se uma forma de validação objetiva para o vocabulário automaticamente obtido, com o qual uma taxonomia automaticamente gerada é representada. Para isso, o vocabulário gerado é comparado ao de uma taxonomia pré-existente, já validada, bem aceita e que use um thesaurus ou dicionário específico do domínio. Como taxonomias validadas foram utilizadas algumas árvores da Agência de Informação Embrapa e como vocabulário padrão o contido no Thesagro.
Tipo: Artigo em anais de congresso (ALICE) Palavras-chave: Taxonomias de tópicos; Vocabulário controlado; Extração de termos; Topic taxonomies; Controled vocabulary; Term extraction; Thesagro; Thesaurus for agriculture.
Ano: 2009 URL: http://www.alice.cnptia.embrapa.br/handle/doc/656852
Imagem não selecionada

Imprime registro no formato completo
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. Infoteca-e
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O..
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados...
Tipo: Boletim de Pesquisa e Desenvolvimento (INFOTECA-E) Palavras-chave: Recuperação da informação; Seleção de atributos; N-gramas; Atributos redundantes; Mineração de textos; Dados categorizados; Attribute selection; Information retrieval; N-grams; Redundant attribute; Text mining; Categorical data.
Ano: 2010 URL: http://www.infoteca.cnptia.embrapa.br/handle/doc/885611
Imagem não selecionada

Imprime registro no formato completo
Winning some of the document preprocessing challenges in a text mining process. Repositório Alice
NOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O..
Considering the huge growth of the number of documents in the digital universe and the possibility of obtaining some competitive advantage in processing them, this paper describes some of the difficulties of working with text collections. More specifically, it shows some of the challenges on the step considered one of the most important of the Text Mining process - the data preprocessing - focusing on two of its main tasks: attribute generation and selection, considering not only single terms but composed terms too. In order to overcome the challenges imposed by these problems, this paper presents efficient unsupervised solutions. The application of these solutions in three real data sets is presented in order to evaluate them and to show a way to treat...
Tipo: Artigo em anais de congresso (ALICE) Palavras-chave: Dados semânticos; Mineração de textos; Text mining.
Ano: 2008 URL: http://www.alice.cnptia.embrapa.br/handle/doc/5283
Registros recuperados: 4
Primeira ... 1 ... Última
 

Empresa Brasileira de Pesquisa Agropecuária - Embrapa
Todos os direitos reservados, conforme Lei n° 9.610
Política de Privacidade
Área restrita

Embrapa
Parque Estação Biológica - PqEB s/n°
Brasília, DF - Brasil - CEP 70770-901
Fone: (61) 3448-4433 - Fax: (61) 3448-4890 / 3448-4891 SAC: https://www.embrapa.br/fale-conosco

Valid HTML 4.01 Transitional