Multi30K (Multimodal Translation and Captioning)|多模态翻译数据集|图像描述生成数据集
收藏
- Multi30K数据集首次发表,旨在解决多模态翻译和图像描述生成问题,包含约30,000张图片及其对应的英文和德文描述。
- Multi30K数据集首次应用于多模态机器翻译研究,展示了其在跨语言图像描述生成任务中的有效性。
- Multi30K数据集扩展至包括法语和捷克语描述,进一步推动了多语言多模态翻译研究的发展。
- Multi30K数据集在多个国际会议和期刊上被广泛引用,成为多模态翻译和图像描述生成领域的标准基准数据集。
- Multi30K数据集的进一步扩展和更新,增加了更多的语言对和图像,提升了数据集的多样性和覆盖范围。
- 1Multi30K: Multimodal Translation and Captioning for English-GermanUniversity of Edinburgh · 2016年
- 2Attention is All You NeedGoogle Brain · 2017年
- 3Improving Neural Machine Translation with Conditional Sequence Generative Adversarial NetsUniversity of Edinburgh · 2018年
- 4Multimodal Machine Translation with Reinforcement LearningUniversity of Edinburgh · 2019年
- 5Multimodal Neural Machine Translation with Deep FusionUniversity of Edinburgh · 2020年
ROBEL
ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。
arXiv 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录