five

WMT中英机器翻译小量训练集

收藏
魔搭社区2026-05-20 更新2025-11-08 收录
下载链接:
https://modelscope.cn/datasets/smallzh/wmt_zh_en_training_corpus_less
下载链接
链接失效反馈
官方服务:
资源简介:
中英文翻译小量数据集

Small-scale Chinese-English Translation Dataset
提供机构:
maas
创建时间:
2025-11-04
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是从WMT中英机器翻译训练集中抽取的6万条数据,专为Transformer模型学习设计,包含用于训练、评估和测试的三个子集。数据以CSV格式存储,支持中英文双向翻译任务,最大句子长度为65个词。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务