Seleção de sintagmas nominais na indexação automática-Reference-Cited by-同舟云学术

Seleção de sintagmas nominais na indexação automática

Published:2019-05-06 Issue:55 Volume:24 Page:1-19
ISSN:1518-2924
Container-title:Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação
language:
Short-container-title:Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf.

Author:

Nascimento Gustavo Diniz do^ORCID,Correa Renato Fernandes^ORCID

Abstract

O uso dos sintagmas nominais como instrumentos de organização da informação vem se mostrando uma alternativa promissora às palavras isoladas na construção dos sistemas de recuperação de informação. Nesse contexto, a indexação automática por sintagmas nominais minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, como, por exemplo, a sinonímia e a polissemia. No entanto, é notório que nem todos os sintagmas nominais que se encontram em um documento são representativos do conteúdo desse documento, o que demonstra a necessidade de se selecionar os sintagmas nominais mais relevantes. Assim, o objetivo deste estudo consiste em sintetizar e classificar critérios de seleção de sintagmas nominais utilizados em metodologias de indexação automática por sintagmas nominais para textos escritos em língua portuguesa. A metodologia da pesquisa tem natureza exploratória, de cunho bibliográfico, e tem como método procedimental a análise de conteúdo. As metodologias de seleção de sintagmas nominais baseiam-se em critérios como: frequência absoluta de ocorrência, frequência normalizada de ocorrência, frequência inversa nos documentos, não ocorrência em lista de sintagmas nominais pouco significativos, na estrutura gramatical e no nível dos sintagmas nominais. Quanto ao escopo dos critérios, predominam em número os baseados em características do sintagma nominal (estrutura gramatical, nível, conteúdo lexical) e quanto a adoção predominam os baseados no conteúdo do documento e no conteúdo do corpus. A principal contribuição deste estudo consiste do panorama dos critérios de seleção de sintagmas nominais relevantes para textos em português.

Publisher

Universidade Federal de Santa Catarina (UFSC)

Subject

Library and Information Sciences,Information Systems,Management Information Systems