five

COCO Multi-Modal Reasoning (COCO-MMR)|多模态推理数据集|人工智能评估数据集

收藏
arXiv2023-09-25 更新2024-06-21 收录
多模态推理
人工智能评估
下载链接:
https://github.com/weijingxuan/COCO-MMR
下载链接
链接失效反馈
资源简介:
COCO-MMR数据集是由中国科学院沈阳计算技术研究所创建的一个新型多模态推理数据集,旨在通过开放式问题评估链式思维(CoT)模型的推理能力。该数据集基于大型对象数据集COCO,包含约62,351个问题、理由和答案,是现有ScienceQA数据集的三倍大小。COCO-MMR不仅规模更大,而且引入了开放式问题,使得评估更加全面和挑战性。此外,数据集设计涵盖了多样化的日常生活场景,从而将推理任务扩展到更广泛的现实世界情境中,有助于评估模型是否能像人类一样广泛应用常识知识和推理来理解各种概念和情况。
提供机构:
中国科学院沈阳计算技术研究所
创建时间:
2023-07-24
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

2000-2018年中国典型生态系统植物生长节律数据

该数据集涵盖了森林、草地、荒漠、沼泽、农田生态系统2000年-2020年CERN长期定位监测的植物物候数据和主要作生育期数据,包括木本植物、草本植物、水稻、小麦、玉米物候数据表,木本植物数据表有18个台站、291个物种的芽开放期、展叶期、开花始期、开花盛期、果实或种子成熟期、叶秋季变色期和落叶期共计3814条记录;草本植物数据表有22个台站、312个物种的萌动期、开花期、果实或种子成熟期、种子散布期和黄枯期共计3032条数据;水稻数据表有9个台站的出苗期、拔节期、蜡熟期等10个生育期共551条记录;小麦数据表有9个台站不同生育期382条记录;玉米数据表有18个台站不同生育期532条数据。

地球大数据科学工程 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

HIT-dataset

这是一个基于旋转器和壳体振动信号的轴承数据集,来源于带有轴承故障的航空发动机测试。

github 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录