five

Corpus - Textes en Pictogrammes - Adultes avec une Déficience Intellectuelle

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/french-text-to-picto/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Ce corpus a été créé dans le cadre de la thèse de doctorat de Magali Norré au Centre de Traitement automatique du Langage (CENTAL), Université catholique de Louvain (UCLouvain) et au Département de Traitement Informatique Multilingue (TIM), Université de Genève (UNIGE) : Traduction automatique du français vers les pictogrammes pour améliorer la communication entre médecins et patients avec une déficience intellectuelle en milieu hospitalier. Sous la direction du Prof. Thomas François (CENTAL, UCLouvain), de la Prof. Pierrette Bouillon (TIM, UNIGE) et du Dr. Vincent Vandeghinste (Instituut voor de Nederlandse Taal amp; KULeuven).Il contient plusieurs sous-corpus qui ont été conçus pour adapter au français, améliorer ou évaluer deux systèmes de traduction automatique vers les pictogrammes : Text-to-Picto et PictoDr.Text-to-Picto : système néerlandais développé à l'origine par le Dr. Vincent Vandeghinste et la Dr. Leen Sevens de la KULeuven pour traduire automatiquement les emails/tweets néerlandais, anglais et espagnols vers les pictogrammes Sclera et Beta pour les personnes avec une déficience intellectuelle. Retrouvez plus d'informations sur ce site : https://github.com/VincentCCL/PictoPictoDr : système créé dans le cadre du projet bilatéral franco-suisse PROPICTO, financé par l'Agence National de la Recherche (ANR-20-CE93-0005) et le Fonds National Suisse de la recherche scientifique (N°197864). Ce projet est porté par le Laboratoire d'Informatique de Grenoble (LIG), Université Grenoble Alpes (UGA) et le département de Traitement Informatique Multilingue (TIM), Université de Genève. Retrouvez plus d'informations sur ces sites : https://propicto.unige.ch | https://hdl.handle.net/11403/propictoNous avons adapté le système de traduction automatique Text-to-Picto au français écrit (langue source) et ajouté l'ensemble de pictogrammes libres de droit Arasaac (langue cible). La démo de la version française est disponible ici : https://text2picto.ccl.kuleuven.be/text2picto_french/web/french/index_fr_speech.phpLes pictogrammes Arasaac sont la propriété du Gouvernement d'Aragon et sont l'œuvre de Sergio Palao pour Arasaac qui les distribue sous licence Creative Commons : https://arasaac.orgLes métadonnées proviennent de l'API du site officiel Arasaac : https://arasaac.org/developers/apiLe projet a été financé par des bourses UCL-FSR (N°13936.2020 et N°17005.2022) de l'UCLouvain, il s'inscrit aussi en partie dans le projet ANR-SNF PROPICTO.Les sous-corpus incluent :Plusieurs corpus traduits manuellement en pictogrammes Arasaac (et/ou adaptés) par nous (Corpus Email, Corpus Médical), par une logopède/orthophoniste belge (Corpus Médical) ou par Céline Vaschalde (Corpus Livre). Le Corpus Email provient du site WAI-NOT utilisé par des personnes avec une déficience intellectuelle en Flandre (Belgique), il a été récolté par la Dr. Leen Sevens et traduit en français par nous. Le Corpus Livre contient des histoires pour enfants libres de droit. Le Corpus Médical est composé de phrases du système de traduction médicale BabelDr conçu à Genève. Les tables du système Text-to-Picto français (dictionnaire de pictogrammes Arasaac, dictionnaire de pictogrammes Sclera adapté de Vincent Vandeghinste et Leen Sevens, dictionnaire de pictogrammes Beta adapté de Vincent Vandeghinste et Leen Sevens, WOLF, WoNeF coverage, WoNeF fscore, WoNeF precision, ReSyf, dictionnaire de paraphrases médicales).800 simplifications automatiques françaises produites par 8 grands modèles de langue génératifs et leur traduction automatique en pictogrammes Arasaac avec Text-to-Picto.Corpus des deux études utilisateurs composé des retranscriptions de 19 entretiens individuels entre une facilitatrice et un adulte avec une déficience intellectuelle sur la compréhension de phrases en pictogrammes Arasaac. La première étude comprend 9 entretiens, la deuxième 10 entretiens. Deux personnes ont annoté manuellement la compréhension des - phrases en - pictogrammes pour chaque participant. Les entretiens sont anonymisés. Un consentement libre et éclairé oral/écrit a été obtenu de chaque participant.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作