【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
AI Challenger 2017
收藏阿里云天池2026-05-08 更新2024-04-21 收录
下载链接:
https://tianchi.aliyun.com/dataset/174937
下载链接
链接失效反馈官方服务:
资源简介:
由创新工场、搜狗、今日头条联合举办的“AI challenger全球AI挑战赛”,数据集为英中机器文本翻译
Co-hosted by Innovation Works, Sogou, and Toutiao, the AI Challenger Global AI Challenge provides an English-Chinese machine text translation dataset.
提供机构:
阿里云天池
创建时间:
2024-04-09
搜集汇总
数据集介绍

背景与挑战
背景概述
AI Challenger 2017数据集是一个用于英中机器文本翻译的大规模双语语料库,由创新工场、搜狗和今日头条在2017年联合举办的全球AI挑战赛提供。该数据集包含高达1千万的中英双语句对,是开放中英语料中仅次于联合国平行语料库的规模,专注于口语领域,所有句对经过人工检查以确保质量和相关度。数据集包括10,000,000句的训练集,以及934句的同声传译验证集和8000句的文本翻译验证集,适用于机器翻译模型的训练和评估。
以上内容由遇见数据集搜集并总结生成



