|
|
|
|
| |
|
|
MOURA, M. F.; SANTOS, F. F. dos; MARCACINI, R. M.; REZENDE, S. O.. |
Para facilitar a compreensão de uma coleção de documentos, pode-se organizá-la em grupos hierárquicos e obter descritores para cada um dos grupos automaticamente. O problema que se apresenta é decidir entre métodos de agrupamentos e de descrição dos grupos, que sejam eficientes e apresentem bons resultados. Particularmente, este trabalho apresenta uma proposta para a comparação entre resultados obtidos a partir de métodos de seleção de descritores em agrupamentos hierárquicos de documentos, especificamente para métodos independentes do algoritmo de agrupamento utilizado. Para esses métodos, dado um agrupamento hierárquico, o objetivo é selecionar descritores (palavras ou sentenças) discriminativos dos grupos, preferencialmente sem repetição de descritores... |
Tipo: Folhetos |
Palavras-chave: Descritores de agrupamento; Agrupamento hierárquico; Mineração de texto; Modelos lineares generalizado; Análise de variância; Recuperação de informação; Generalized linear models; Mutual information mean; Multiple mean comparisons; Hierarchical document clusters descriptors. |
Ano: 2010 |
URL: http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/885560 |
| |
|
| |
|
| |
|
|
MOURA, M. F.; MEDEIROS, C. M.. |
Resumo - A proposta deste trabalho é utilizar um reconhecedor de entidades nomeadas para a língua portuguesa, a fim de extrair metadados de citações a localizações geográficas brasileiras em publicações técnico-científicas do domínio agrícola. A estratégia adotada consistiu na identificação de padrões de citação a localidades de interesse, a partir da criação de uma coleção dourada, e a consequente personalização do reconhecedor de entidades nomeadas da biblioteca SpaCy. Os experimentos conduzidos, com os novos treinamentos da SpaCy, mostram uma revocação média de 0,92 e uma precisão média de 0,95, permitindo aceitar que a acurácia para a identificação das localidades nos textos seja bastante confiável. |
Tipo: Folhetos |
Palavras-chave: Mineração de texto; Reconhecimento de entidades nomeadas; SpaCy. |
Ano: 2022 |
URL: http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1150456 |
| |
|
|
|