five

CEFC-GOLD

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/cefc-gold/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Une nouvelle version est en préparation. Dans l'attente de cette version les données ne sont pas accessibles.Le CEFC-Gold est un corpus d'entraînement de 172 000 mots constitué à partir d'extraits représentants l'essentiel des genres présents dans le CEFC.Il a fait l'objet d'un traitement automatique suivi d'une validation et d'une correction manuelle : segmentation et annotations en POS et en dépendances syntaxiques.Les modèles utilisés pour le traitement automatique ont été appris sur le FrenchTreebank et le corpus Decoda.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作