Affiliation:
1. Universidade Federal de Campina Grande, Brasil
2. Universidade Federal de Pernambuco, Brasil
Abstract
Resumo O presente estudo avalia critérios para seleção de sintagmas nominais mais representativos do conteúdo de documentos jurídicos em língua portuguesa. A metodologia da pesquisa consistiu em revisão de literatura brasileira e experimento. No experimento foram aplicados dez critérios de seleção aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações. Os critérios foram avaliados quanto à eficácia na seleção de sintagmas nominais relevantes para a recuperação da informação. Por meio do experimento, foram identificados como mais eficazes os critérios de eliminação de sintagmas nominais considerados stopwords ou contendo pronomes no núcleo, e os critérios de seleção por posição de ocorrência, nível do sintagma nominal, inverso da frequência nos documentos e frequência de ocorrência em um documento.
Subject
Library and Information Sciences,Museology,Information Systems
Reference22 articles.
1. The Parsing System “Palavras”: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework;Bick E,2000
2. Indexação automática e semântica: estudo da análise do conteúdo de teses e dissertações;Borges G. S. B;Informação e Sociedade. Estudos,2008
3. Indexação e recuperação de teses e dissertações por meio de sintagmas nominais;Correa R. F.;AtoZ,2011
4. Panorama de estudos sobre indexação automática no âmbito da Ciência da Informação no Brasil (1973-2012);Correa R. F;Ciência da Informação,2013
5. SemEval-2010 Task 5: Automatic keyphrase extraction from scientific articles.;Kim S. N.;Lang Resources and Evaluation,2013
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献