MUIRBENCH/MUIRBENCH|问答数据集|视觉问答数据集
收藏MuirBench 数据集概述
基本信息
- 语言: 英语
- 许可证: CC-BY-4.0
- 数据规模: 1K<n<10K
任务类别
- 问答
- 视觉问答
- 多选题
数据集名称
- 名称: MuirBench
数据集特征
- 特征列表:
idx
: 字符串类型task
: 字符串类型image_relation
: 字符串类型image_type
: 字符串类型question
: 字符串类型options
: 字符串序列answer
: 字符串类型image_list
: 图像序列counterpart_idx
: 字符串类型
数据集分割
- 分割信息:
test
:- 字节数: 2280382684.8
- 样本数: 2600
数据集大小
- 下载大小: 429440985
- 数据集大小: 2280382684.8
配置信息
- 配置名称: default
- 数据文件:
test
:- 路径: data/test-*
TM-Senti
TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。
arXiv 收录
上奇产业通
上奇产业通是依托北京上奇数字科技有限公司(简称“上奇”)自主研发的产业知识计算引擎,推出的新一代“产业情报和智能决策”SaaS账号系统。平台覆盖200余个产业链图、100万种产品、5000万家企业等,利用产业知识计算引擎的数据、算法和模型,提供产业数据和关系的一站式信息搜索、图谱绘制、内容订阅、报告生成、企业尽调、项目推荐等服务,支撑行业研究、精准招商和投资决策等。
北京国际大数据交易所 收录
RDD2022
RDD2022是一个多国图像数据集,用于自动道路损伤检测,由印度理工学院罗凯里分校交通系统中心等机构创建。该数据集包含来自六个国家的47,420张道路图像,标注了超过55,000个道路损伤实例。数据集通过智能手机和高分辨率相机等设备采集,旨在通过深度学习方法自动检测和分类道路损伤。RDD2022数据集的应用领域包括道路状况的自动监测和计算机视觉算法的性能基准测试,特别关注于解决多国道路损伤检测的问题。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录