CoCoDoc-MT
收藏Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/FiveC/CoCoDoc-MT
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多语言平行翻译文本,主要特征包括:文档ID(doc_id)、组织机构信息(organization)、源语言(source_lang)与目标语言(target_lang)标识、原文(translation_source)与译文(translation_target)内容、以及对应的源/目标URL链接(url_source/url_target)。数据集划分为训练集(68个样本)、验证集(9个样本)和测试集(9个样本),总大小约29.2MB。数据文件按标准分割存储于train-*/validation-*/test-*路径下,适用于机器翻译模型训练与跨语言研究。
创建时间:
2026-03-11



