WMT14|机器翻译数据集|自然语言处理数据集
收藏
- WMT14数据集首次发布,作为机器翻译领域的重要基准数据集,旨在评估和比较不同机器翻译系统的性能。
- WMT14数据集在多个国际机器翻译比赛中被广泛应用,成为评估新算法和模型的重要工具。
- 基于WMT14数据集的研究成果显著增多,推动了神经机器翻译技术的快速发展。
- WMT14数据集被纳入多个机器翻译系统的训练和测试流程,进一步验证了其在行业中的重要性。
- WMT14数据集的相关研究论文数量达到高峰,成为学术界和工业界共同关注的焦点。
- WMT14数据集在机器翻译领域的应用持续扩展,支持了多种语言对之间的翻译研究。
- WMT14数据集被用于评估新一代机器翻译模型的性能,推动了翻译质量的进一步提升。
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国知识产权局专利数据库
该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。
www.cnipa.gov.cn 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
中国人口普查分县数据(2000、2010、2020年)
中国人口普查分县数据(2000、2010、2020年)数据集是中国第五次、第六次、第七次人口普查分县数据
国家地球系统科学数据中心 收录
573,264张试卷&练习册&答题卡采集数据【数据堂】
573,264张试卷&练习册&答题卡采集数据。数据包含35,823张试卷、457,970张练习册、79,471张答题卡。数据涵盖多种题型、多种学科、多种类型、多个年级。采集设备为手机、扫描仪。数据可用于智能判卷、作业辅导等任务。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR, CCPA, PIPL
OpenDataLab 收录