five

Corpus écrits d'apprenants et acquisition de L2 (CEAAL2)

收藏
DataCite Commons2026-02-13 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/ceaal2/v7
下载链接
链接失效反馈
官方服务:
资源简介:
Ce corpus est composé de 523 textes réalisés par deux types de scripteurs. D'un côté, nous avons rassemblé les productions des scripteurs natifs de différentes langues (le français, le polonais, le russe, l'indonésien et le chinois) qui représentent pour nous les groupes de contrôle dans l'étude des phénomènes d'acquisition du français langue seconde (L2) ou langue étrangère (LE). Les productions d'apprenants de ces mêmes langues, en tant que langue maternelle, constituent le cœur de ce corpus. Les productions recueillies sont du même type, à savoir l'argumentation, mais représentent deux genres différents: essai argumenté et lettre formelle. Tous les textes sont rédigés en conditions d'examen en temps limité à une heure. Ils ont tous été saisis sur Word en respectant la mise en page d'origine et les erreurs éventuelles. Le corpus comporte les méta-données, à savoir l'âge et le sexe du participant, ainsi que son niveau d'étude et les langues parlées. Voici le nombre de textes par catégorie: Productions de groupes de contrôle Francophones natifs (essai argumenté) : 41Francophones natifs (lettre formelle) : 58Polonophones natifs (essai argumenté) : 10 Russophones natifs (lettre formelle) : 37Sinophones natifs (lettre formelle) : 15Indonésiens natifs (lettre formelle) : 15Productions d'apprenants Apprenants sinophones (contexte homoglotte, essai argumenté) : 9Apprenants sinophones (contexte homoglotte, lettre formelle, DSA, Licence, Master) : 35Apprenants sinophones (contexte homoglotte, lettre formelle, DU LLFC) : 22Apprenants sinophones (contexte hétéroglotte, lettre formelle) : 66Apprenants polonophones (contexte hétéroglotte, lettre formelle, essai argumenté) : 73Apprenants russophones (contexte hétéroglotte, lettre formelle) : 51Apprenants indonésiens (contexte hétéroglotte, lettre formelle) : 17Groupes hétérogènes en contexte homoglotte (lettre formelle, essai) : 74Ces données ont été recueillies au sein du laboratoire LIDILEM. Elles ont en partie été traitées grâce au soutien financier de ce laboratoire. Ce travail a également bénéficié d'une aide de l'État gérée par l'Agence Nationale de la Recherche au titre du programme « Investissements d'avenir » portant la référence « ANR-15-IDEX-02 ».
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作