UMINNA : Corpus COVID-19 et étude sur les usages des DCI dans différents types de discours
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/uminna/v1
下载链接
链接失效反馈官方服务:
资源简介:
Ce jeu de données rassemble des ressources textuelles, quantitatives et méthodologiques mobilisées dans le cadre d’un travail exploratoire consacré à l’analyse des DCI (Dénominations Communes Internationales) dans une perspective linguistique de corpus du sujet UMINNA (Uses and Misuses of International Nonproprietary Names).Ce projet vise à interroger la circulation, l’adoption et la stabilisation des DCI par rapport aux noms commerciaux de médicaments à travers différents types de discours (scientifique, médiatique, grand public).Ce dépôt se compose de plusieurs dossiers thématiques correspondant aux grandes étapes de l’analyse, en lien avec les hypothèses de travail (fréquences, cooccurrents, reformulations). Pour les dossiers concernant les fréquences, cooccurrents et les reformulations : chaque dossier contient des données brutes extraites avec TXM, des résumés sous forme de tableaux, des représentations graphiques selon la thématique. Les corpus COCA ACAD et COCA MAG ont été importés en trois périodes temporelles. Les fichiers de données (fréquences, cooccurrence, et concordances) sont suffixés par _1, _2 ou _3 pour indiquer la période correspondante (1 : 1990-1999, 2 : 2000-2009 et 3: 2010-2019).#Corpus sur la vaccination COVIDCe dossier contient le corpus scientifique spécialisé ANTCORGEN, constitué spécifiquement pour ce projet. Il rassemble des publications scientifiques en anglais sur la vaccination COVID-19 de 2020 à 2025 extraites à partir de l’outil AntCorgGen (Note : il s'agit du corpus final, nettoyé après extraction des métadonnées).Le corpus : Contient des articles sous la forme .txtUn fichier de métadonnées structuréesUne description sur la méthodologie de création du corpus et de création des métadonnées#Mots-clésCe dossier contient les mots-clés des corpus utilisés dans le cadre de cette recherche autour des DCI. Les mots-clés ont étés obtenus via le logiciel AntConc (fonction “Keyword List”) qui repère les termes caractéristiques d’un corpus en les comparant à une référence externe (corpus cible), en fonction de leur surreprésentation. #DCI dans les corpusCe dossier contient un tableau récapitulatif des DCI identifiées dans chaque corpus, ainsi que la méthodologie d'identification des DCI.Des graphiques résumant les 30 premières DCI les plus fréquentes sont disponibles au format png.#FréquencesCe dossier contient les fréquences relevées pour les DCI étudiées ainsi que des graphiques associés dans le but de répondre à nos hypothèses.#CooccurrentsCe dossier regroupe le résultat des analyses de cooccurrence lexicale de TXM permettant d'identifier les environnements sémantiques caractéristiques des DCI et noms commerciaux. Les données sont structurées par DCI étudiées, avec la période indiquée avec un suffixe, le cas échéant.#ReformulationsLes reformulations sont des segments discursifs qui accompagnent les DCI
(ou les noms commerciaux), servant à préciser, qualifier, évaluer ou
expliciter leur nature, leur usage ou leur statut. Elles jouent un rôle
essentiel dans la médiation terminologique, notamment dans les contextes
où le lectorat n’est pas familier avec la dénomination elle-même.Ces
reformulations constituent un indice discursif : elles révèlent comment
une DCI est comprise, présentée, justifiée ou critiquée dans différents
types de discours. Leur étude permet ainsi de mieux cerner la réception
sociale des DCI mais aussi d’observer les stratégies langagières qui
participent à leur légitimation ou non.Ce dossier contient le matériel d’annotation manuelle des reformulations discursives identifiées autour des DCI et des noms commerciaux. Il comprend :les fichiers annotés (au format .xlsx), catégorisant les reformulationsle guide d’annotation défini pour annoter ces reformulationsdes tableaux de synthèses dans le but d’une analyse quantitative#ConcordancierCe dossier regroupe des extraits contextuels issus de TXM pour un ensemble de DCI et de noms commerciaux sélectionnés dans les corpus. Ces contextes ont servi de base :à l’annotation des reformulationsà l’analyse qualitative du discoursDCI étudiées pour la thématique - Fréquences / Cooccurrents / Concordancieralendronateamoxicillinatorvastatinbaclofenbuprenorphineclopidogreldiazepamdocetaxeldonepezilelasomeranfentanylfluoxetineformoterolhydroxychloroquineibuprofeninfliximabivermectinmetforminmethylphenidatemodafinilmolnupiravirnirmatrelvir-ritonaviromeprazolepaclitaxelparacetamolparoxetinepravastatinranitidineremdesivirrisperidonesildenafiltamoxifentopiramatetozinameranvenlafaxinezidovudineDCI étudiées pour la thématique - Reformulationtozinameran / Comirnatyivermectin / Stromectolmolnupiravir / Lagevrioremdesivir / Veklurymetformin / Glucophagetamoxifen / Nolvadexibuprofen / Advilsildenafil / ViagraPour les DCI suivantes, les reformulations ont étés relevées mais n’ont ni fait l’objet d’une annotation ni d’une analyse : clopidogrelmethadonenaproxenfentanyltetracyclineprednisone
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



