WMT|机器翻译数据集
收藏
- WMT(Workshop on Machine Translation)首次举办,标志着机器翻译领域的一个重要里程碑。
- WMT开始引入共享任务,促进了不同研究团队之间的竞争与合作,推动了机器翻译技术的快速发展。
- WMT引入了新的评估指标,如BLEU和TER,进一步提升了翻译质量的评估标准。
- WMT开始支持多语言翻译任务,扩展了其应用范围,涵盖了更多语言对。
- WMT引入了神经机器翻译(NMT)作为主要研究方向,标志着机器翻译技术进入了一个新的时代。
- 1Findings of the 2021 Conference on Machine Translation (WMT21)Association for Computational Linguistics · 2021年
- 2Findings of the 2020 Conference on Machine Translation (WMT20)Association for Computational Linguistics · 2020年
- 3Findings of the 2019 Conference on Machine Translation (WMT19)Association for Computational Linguistics · 2019年
- 4Findings of the 2018 Conference on Machine Translation (WMT18)Association for Computational Linguistics · 2018年
- 5Findings of the 2017 Conference on Machine Translation (WMT17)Association for Computational Linguistics · 2017年
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
Pima Indians Diabetes Database
该项目使用的数据集是Pima Indians Diabetes Database,来源于UCI机器学习库。该数据集包含多个医学预测变量和一个目标变量,即Outcome,用于指示患者是否患有糖尿病(1)或未患(0)。
github 收录