five

MUIRBENCH/MUIRBENCH|问答数据集|视觉问答数据集

收藏
hugging_face2024-07-01 更新2024-06-12 收录
问答
视觉问答
下载链接:
https://hf-mirror.com/datasets/MUIRBENCH/MUIRBENCH
下载链接
链接失效反馈
资源简介:
MuirBench是一个包含11,264张图片和2,600个多项选择题的基准数据集,用于评估12种多图像理解任务。该数据集涵盖了多种多图像关系(如叙事、互补等),并通过不可回答实例变体提供了对模型的鲁棒性评估。MuirBench旨在鼓励社区开发能够超越单图像理解的多模态LLMs。
提供机构:
MUIRBENCH
原始信息汇总

MuirBench 数据集概述

基本信息

  • 语言: 英语
  • 许可证: CC-BY-4.0
  • 数据规模: 1K<n<10K

任务类别

  • 问答
  • 视觉问答
  • 多选题

数据集名称

  • 名称: MuirBench

数据集特征

  • 特征列表:
    • idx: 字符串类型
    • task: 字符串类型
    • image_relation: 字符串类型
    • image_type: 字符串类型
    • question: 字符串类型
    • options: 字符串序列
    • answer: 字符串类型
    • image_list: 图像序列
    • counterpart_idx: 字符串类型

数据集分割

  • 分割信息:
    • test:
      • 字节数: 2280382684.8
      • 样本数: 2600

数据集大小

  • 下载大小: 429440985
  • 数据集大小: 2280382684.8

配置信息

  • 配置名称: default
  • 数据文件:
    • test:
      • 路径: data/test-*
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

arXiv 收录

上奇产业通

上奇产业通是依托北京上奇数字科技有限公司(简称“上奇”)自主研发的产业知识计算引擎,推出的新一代“产业情报和智能决策”SaaS账号系统。平台覆盖200余个产业链图、100万种产品、5000万家企业等,利用产业知识计算引擎的数据、算法和模型,提供产业数据和关系的一站式信息搜索、图谱绘制、内容订阅、报告生成、企业尽调、项目推荐等服务,支撑行业研究、精准招商和投资决策等。

北京国际大数据交易所 收录

RDD2022

RDD2022是一个多国图像数据集,用于自动道路损伤检测,由印度理工学院罗凯里分校交通系统中心等机构创建。该数据集包含来自六个国家的47,420张道路图像,标注了超过55,000个道路损伤实例。数据集通过智能手机和高分辨率相机等设备采集,旨在通过深度学习方法自动检测和分类道路损伤。RDD2022数据集的应用领域包括道路状况的自动监测和计算机视觉算法的性能基准测试,特别关注于解决多国道路损伤检测的问题。

arXiv 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录