HRScene|高分辨率图像理解数据集|视觉语言模型数据集
收藏HRScene数据集概述
数据集简介
- 名称: HRScene
- 目的: 评估视觉大语言模型(VLMs)在高分辨率图像(HRI)理解方面的能力
- 特点:
- 首个统一的HRI理解基准
- 包含丰富场景的高分辨率图像
- 分辨率范围: 1,024×1,024至35,503×26,627像素
数据集构成
- 来源:
- 25个真实世界数据集
- 2个合成诊断数据集
- 标注:
- 由10名研究生级别标注员重新标注
- 覆盖25种场景(从显微镜到望远镜图像)
- 样本量: 7,081张图像(其中2,008张重新标注)
数据集分类
- 8个任务类别:
- Daily pictures
- Urban planning
- Paper scanned images
- Artwork
- Multi-subimages
- Remote sensing
- Medical Diagnosing
- Research understanding
数据集划分
- val: 750个样本(与人工标注样本相同)
- testmini: 1,000个样本(来自各真实世界数据集)
- test: 5,323个样本(答案标签不公开)
评估结果
- 模型表现:
- 当前VLMs平均准确率约50%
- 在合成数据集上表现差距超过20%
- 最佳表现模型: Qwen2-VL 72B(62.03%准确率)
诊断数据集发现
- 区域发散现象: 模型在不同图像区域表现不一致
- 曼哈顿距离现象: 性能随距离呈U型变化
数据访问
- 下载地址: Hugging Face Dataset
- 评估平台: 提供在线评估服务
模型提交
- 提交方式: 通过EvalAI平台
- 工具支持: 提供自动模型预测和提交管道
关键统计
- 图像分辨率分布: 从1k到超过35k像素
- 任务类型分布: 覆盖多种视觉上下文类型
- 问题长度分布: 记录每个问题的单词数分布

中国区域地面气象要素驱动数据集 v2.0(1951-2024)
中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。
国家青藏高原科学数据中心 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
Photovoltaic power plant data
包括经纬度、电源板模型、NWP等信息。
github 收录
Stanford Cars
Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。
OpenDataLab 收录
