five

TCOF : Traitement de Corpus Oraux en Français

收藏
DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/tcof/v2.2
下载链接
链接失效反馈
官方服务:
资源简介:
Le projet « Traitement de Corpus Oraux en Français » (TCOF) est né de la volonté de conserver des corpus oraux collectés dans les années 80-90 à des fins de recherches personnelles. L’équipe constituée au sein du laboratoire ATILF (UMR CNRS 7118) a élaboré l’architecture d’une première base de données de corpus alignés texte/son avec Transcriber. Celle-ci s’est progressivement enrichie à partir des années 2000 grâce à la collaboration d’autres (enseignants-)chercheurs, d’ITA et d’étudiants en Sciences du langage de l’université de Nancy 2. Aujourd'hui, l’équipe met à disposition de la communauté scientifique une partie de ses ressources. Cette mise à disposition sera progressive, au fur et à mesure du traitement des données.Le corpus mis à disposition comporte deux grandes catégories : des enregistrements d'interactions adultes-enfants (enfants jusque 7 ans) et des enregistrements d'interactions entre adultes. Les enregistrements sont de durées diverses : de 5 à 45 minutes ou plus. A terme, des enregistrements de dialogues avec des enfants atteints d’une pathologie et des dialogues entre natifs et non natifs seront intégrés.Il s'agit, en l'absence de corpus de référence du français parlé, de faciliter l'accès à des données qui restent encore rares, en particulier en ce qui concerne les interactions adulte- enfant, et de compléter les données existantes mises à disposition au travers d'un certain nombre de sites (PFC, CLAPI, CFPP, OFROM, CHILDES, etc.). En cela, nous collaborons avec des initiatives telles que la plateforme ORTOLANG et nous participons au consortium national CORLI.Contenu du corpus (18/05/2020) : 626 transcriptions (Transcriber et WAV), d'une durée totale de 146 heures pour 1.542.562 mots
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作