five

CoCoDoc-MT

收藏
Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/FiveC/CoCoDoc-MT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多语言平行翻译文本,主要特征包括:文档ID(doc_id)、组织机构信息(organization)、源语言(source_lang)与目标语言(target_lang)标识、原文(translation_source)与译文(translation_target)内容、以及对应的源/目标URL链接(url_source/url_target)。数据集划分为训练集(68个样本)、验证集(9个样本)和测试集(9个样本),总大小约29.2MB。数据文件按标准分割存储于train-*/validation-*/test-*路径下,适用于机器翻译模型训练与跨语言研究。
创建时间:
2026-03-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作