five

A representação temática de artigos da área de saúde pública em português: um olhar particular da indexação automática

收藏
DataCite Commons2025-08-08 更新2024-07-13 收录
下载链接:
https://arcadados.fiocruz.br/citation?persistentId=doi:10.35078/EXYZ5L
下载链接
链接失效反馈
官方服务:
资源简介:
O estudo objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática dos artigos publicados em português na área de saúde pública, com o aporte teórico da mineração de textos. Propôs-se a análise da coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi constituída de 104 textos publicados em português em seis periódicos brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library-SciELO, publicados no ano de 2020. A pesquisa baseou-se na bibliometria, apoiada no processamento da linguagem natural, com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, volume e representação desses textos para a indexação automática dessa produção. O estudo aponta que a coerência dos conteúdos dos artigos estudados poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da a recuperação da informação. Espera-se que este estudo contribua com as pesquisas sobre a indexação de artigos científicos na área de saúde pública, particularmente na coerência semântica da representação de artigos publicados em português e o uso da indexação automática, bem como na prática dos profissionais de informação para organização da produção científica em repositórios e outras plataformas (pt) The study aimed to verify the degree of semantic coherence between the thematic representation via controlled language and the automatic indexing of articles published in Portuguese in the area of public health, with the theoretical support of text mining. It was proposed to analyze the semantic coherence between the content of the selected scientific articles and their representativeness (keywords and descriptors), observing the use of automatic indexing and controlled language in the thematic representation of this health information. The sample used in the analysis consisted of 104 texts published in Portuguese in six Brazilian journals of the Public Health Collection, available at the Scientific Electronic Library-SciELO, published in 2020. The research was based on bibliometrics, supported by natural language processing, using text mining software. It is an exploratory-descriptive study, composed of quantitative and qualitative analysis, which made it possible to understand the form, structure, volume and representation of these texts for the automatic indexing of this production. The study points out that the coherence of the contents of the articles studied could reach a better result with the use of automatic indexing. The method enabled an increase in the number of terms representative of the content of the texts, which is promising for the field of information retrieval. It is hoped that this study will contribute to research on the indexing of scientific articles in the area of public health, particularly in the semantic coherence of the representation of articles published in Portuguese and the use of automatic indexing, as well as in the practice of information professionals for the organization of scientific production in repositories and other platforms (en) El estudio tuvo como objetivo verificar el grado de coherencia semántica entre la representación temática mediante lenguaje controlado y la indexación automática de artículos publicados en portugués en el área de la salud pública, con el apoyo teórico de la minería de textos. Se propuso analizar la coherencia semántica entre el contenido de los artículos científicos seleccionados y su representatividad (palabras clave y descriptores), observando el uso de la indexación automática y del lenguaje controlado en la representación temática de esta información sanitaria. La muestra utilizada en el análisis consistió en 104 textos publicados en portugués en seis revistas brasileñas de la Colección Salud Pública, disponibles en la Biblioteca Electrónica Científica-SciELO, publicadas en 2020. La investigación se basó en la bibliometría, apoyada en el procesamiento del lenguaje natural, utilizando software de minería de texto. Se trata de un estudio exploratorio-descriptivo, compuesto por análisis cuantitativo y cualitativo, que permitió comprender la forma, estructura, volumen y representación de esos textos para la indización automática de esa producción. El estudio señala que la coherencia del contenido de los artículos estudiados podría alcanzar un mejor resultado con el uso de la indexación automática. El método permitió aumentar el número de términos representativos del contenido de los textos, lo que resulta prometedor para el campo de la recuperación de información. Se espera que este estudio contribuya a la investigación sobre la indización de artículos científicos en el área de la salud pública, particularmente en la coherencia semántica de la representación de artículos publicados en portugués y el uso de la indización automática, así como en la práctica de los profesionales de la información para la organización de la producción científica en repositorios y otras plataformas (es)
提供机构:
Arca Dados
创建时间:
2023-07-25
二维码
社区交流群
二维码
科研交流群
商业服务