five

Corpus TextToKids-Émotions

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/texttokids/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Le corpus TextToKids-Émotions est un corpus de 1 594 textes (515K tokens) écrits en français, principalement adressés aux enfants, annoté manuellement en émotions selon un schéma d'annotation motivé sur le plan (psycho-)linguistique. La conceptualisation du schéma d'annotation et l'annotation ont été effectuées via la plateforme d'annotation Glozz.Constitué dans le cadre du projet ANR TextToKids, ce corpus a été pensé pour permettre :l’exploration linguistique de l’expression des émotions dans les textes ;l’entraînement d’un système informatique à même d’identifier automatiquement les informations émotionnelles présentes dans un texte.Ces problématiques ont été abordées par le prisme de la visée générale du projet TextToKids : la compréhension de textes par les enfants.Le corpus TextToKids-Émotions est disponible ici sous sa forme initiale, c'est-à-dire au format Glozz. Il est également disponible tel qu'il a été mobilisé pour entraîner un modèle informatique d'analyse automatique des émotions (corpus ApprentissageAutomatique). L'outil EMOTYC, testable en ligne (https://texttokids.ortolang.fr/), est fondé sur ce modèle.Deux autres sous-corpus tirés de TextToKids-Émotions ayant été utilisés à des fins d'évaluation sont également proposés : le corpus AIA (calcul de l'accord inter-annotateurs) et le corpus EvalPerceptelle (évaluation des annotations de référence et des prédictions du modèle informatique).
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作