Corpus TextToKids-Émotions
收藏DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/texttokids/v1
下载链接
链接失效反馈官方服务:
资源简介:
Le corpus TextToKids-Émotions est un corpus de 1 594 textes (515K tokens) écrits en français, principalement adressés aux enfants, annoté manuellement en émotions selon un schéma d'annotation motivé sur le plan (psycho-)linguistique. La conceptualisation du schéma d'annotation et l'annotation ont été effectuées via la plateforme d'annotation Glozz.Constitué dans le cadre du projet ANR TextToKids, ce corpus a été pensé pour permettre :l’exploration linguistique de l’expression des émotions dans les textes ;l’entraînement d’un système informatique à même d’identifier automatiquement les informations émotionnelles présentes dans un texte.Ces problématiques ont été abordées par le prisme de la visée générale du projet TextToKids : la compréhension de textes par les enfants.Le corpus TextToKids-Émotions est disponible ici sous sa forme initiale, c'est-à-dire au format Glozz. Il est également disponible tel qu'il a été mobilisé pour entraîner un modèle informatique d'analyse automatique des émotions (corpus ApprentissageAutomatique). L'outil EMOTYC, testable en ligne (https://texttokids.ortolang.fr/), est fondé sur ce modèle.Deux autres sous-corpus tirés de TextToKids-Émotions ayant été utilisés à des fins d'évaluation sont également proposés : le corpus AIA (calcul de l'accord inter-annotateurs) et le corpus EvalPerceptelle (évaluation des annotations de référence et des prédictions du modèle informatique).
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10



