DriveBench|自动驾驶数据集|视觉语言模型数据集
收藏数据集概述
数据集名称
DriveBench
数据集简介
DriveBench 是一个用于评估视觉语言模型(VLM)在自动驾驶场景中的可靠性的基准数据集。该数据集涵盖了17种不同的设置(包括干净、损坏和仅文本输入),包含19,200帧图像、20,498个问答对、三种问题类型、四种主流驾驶任务,并评估了12种流行的VLM模型。
数据集特点
- 数据规模:19,200帧图像,20,498个问答对。
- 任务类型:涵盖感知、预测、行为和规划四种主流驾驶任务。
- 评估设置:包括干净、损坏和仅文本输入三种设置。
- 评估模型:12种流行的VLM模型。
数据集结构
- 问题类型:三种问题类型(MCQ、VQA、CAP)。
- 任务类型:感知、预测、行为和规划。
- 评估指标:准确率(Acc)、语言模型评估(Language)、GPT评估(GPT、GPT<sub>ctx</sub>)。
数据集对比
DriveBench 在多个方面优于其他基准数据集,如BDD-X、BDD-OIA、nuScenes-QA等,特别是在任务覆盖范围和数据规模上。
数据集更新
- 2025.01:评估数据可在 HuggingFace Dataset Card 上访问。
- 2025.01:DriveBench 项目正式发布,详细信息请参考 Project Page 和 Preprint。
数据集使用
- 安装:参考 INSTALL.md 进行安装和环境设置。
- 数据准备:参考 DATA_PREPAER.md 准备数据集。
- 快速开始:参考 GET_STARTED.md 了解代码库的使用方法。
数据集评估结果
DriveBench 对多种VLM模型进行了评估,包括商业模型(如GPT-4o)、开源模型(如LLaVA-1.5、LLaVA-NeXT、InternVL2等)和专用模型(如DriveLM-Agent、Dolphins等)。评估结果涵盖了感知、预测、行为和规划任务在不同输入条件下的表现。
数据集鲁棒性分析
DriveBench 还对模型在不同条件下的鲁棒性进行了分析,包括天气、外部环境、传感器、运动和传输等方面。
数据集引用
如需引用该数据集,请参考相关论文和项目页面。

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
豆瓣数据集
该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据,并与movielens ml-latest数据集通过共同的imdb字段进行交集处理,最终得到15752条共同数据。数据存储格式为JSON,支持导入到MongoDB或其他数据库使用。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
ECMWF Reanalysis v5 (ERA5)
ERA5 是第五代 ECMWF 全球气候大气再分析,涵盖从 1940 年 1 月至今的时期。ERA5 由 ECMWF 的哥白尼气候变化服务 (C3S) 制作。 ERA5 提供大量大气、陆地和海洋气候变量的每小时估计值。这些数据以 30 公里的网格覆盖地球,并使用从地表到 80 公里高度的 137 个级别解析大气。ERA5 包括有关所有变量在降低空间和时间分辨率下的不确定性的信息。
OpenDataLab 收录