WMT|机器翻译数据集
收藏
- WMT(Workshop on Machine Translation)首次举办,标志着机器翻译领域的一个重要里程碑。
- WMT开始引入共享任务,促进了不同研究团队之间的竞争与合作,推动了机器翻译技术的快速发展。
- WMT引入了新的评估指标,如BLEU和TER,进一步提升了翻译质量的评估标准。
- WMT开始支持多语言翻译任务,扩展了其应用范围,涵盖了更多语言对。
- WMT引入了神经机器翻译(NMT)作为主要研究方向,标志着机器翻译技术进入了一个新的时代。
- 1Findings of the 2021 Conference on Machine Translation (WMT21)Association for Computational Linguistics · 2021年
- 2Findings of the 2020 Conference on Machine Translation (WMT20)Association for Computational Linguistics · 2020年
- 3Findings of the 2019 Conference on Machine Translation (WMT19)Association for Computational Linguistics · 2019年
- 4Findings of the 2018 Conference on Machine Translation (WMT18)Association for Computational Linguistics · 2018年
- 5Findings of the 2017 Conference on Machine Translation (WMT17)Association for Computational Linguistics · 2017年
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录