five

Vehicle Energy Dataset (VED)|车辆能源数据集|自动驾驶数据集

收藏
arXiv2019-04-19 更新2024-06-21 收录
车辆能源
自动驾驶
下载链接:
https://github.com/gsoh/VED
下载链接
链接失效反馈
资源简介:
Vehicle Energy Dataset (VED)是由密歇根大学创建的一个大规模数据集,包含从2017年11月至2018年11月期间,在美国密歇根州安娜堡收集的383辆个人汽车的燃油和能量数据。该数据集捕捉了车辆的GPS轨迹以及燃油、能量、速度和辅助电源使用的时间序列数据。数据集中的车辆类型多样,包括264辆汽油车、92辆混合动力车和27辆插电式混合动力/电动车。VED数据集总里程约374,000英里,涵盖了从高速公路到交通密集的市中心区域等各种驾驶条件和季节。数据集创建过程中,研究团队通过安装在车辆上的OBD-II记录器收集数据,并对个人身份信息进行了去标识化处理,以保护参与者隐私。VED数据集的应用领域广泛,包括车辆能源消耗建模、驾驶员行为建模、机器学习和深度学习、交通模拟器的校准、最佳路线选择模型、人类驾驶员行为预测以及自动驾驶汽车的决策制定等。
提供机构:
密歇根大学
创建时间:
2019-04-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
Vehicle Energy Dataset (VED) 是由密歇根大学、阿贡国家实验室和爱达荷国家实验室合作构建的,旨在研究人类驾驶行为对能源消耗的影响以及生态驾驶技术的节能潜力。该数据集通过在383辆个人车辆上安装OBD-II数据记录器,收集了从2017年11月至2018年11月期间的车辆GPS轨迹、燃料、能量、速度和辅助电力使用的时间序列数据。数据记录器通过车载诊断系统(OBD-II)接口收集车辆控制区域网络(CAN)信号,确保了数据的连续性和一致性。
特点
VED 数据集的特点在于其大规模和多样性,涵盖了264辆汽油车、92辆混合动力车和27辆插电式混合动力/电动车,行驶里程总计约374,000英里。数据集不仅包括车辆的静态参数,如车辆类型和发动机配置,还包括动态时间序列数据,如GPS信号、标准OBD-II信号和制造商定制的OBD-II信号。此外,VED 还通过隐私保护措施对个人可识别信息进行了匿名化处理,确保数据的安全性和可用性。
使用方法
VED 数据集可用于多种车辆能源消耗研究,包括数据驱动的车辆能源消耗建模、驾驶员行为建模、机器学习和深度学习、交通模拟器的校准、最佳路线选择建模、人类驾驶员行为预测以及自动驾驶汽车的决策制定。研究者可以通过分析车辆的GPS轨迹和时间序列能源数据,深入了解不同驾驶条件下的能源消耗模式,从而优化车辆设计和驾驶策略,推动未来汽车技术的发展。
背景与挑战
背景概述
Vehicle Energy Dataset (VED) 是由密歇根大学、阿贡国家实验室和爱达荷国家实验室共同开发的一个大规模车辆能源消耗数据集。该数据集收集了2017年11月至2018年11月期间在美国密歇根州安娜堡市383辆个人汽车的燃料和能源数据,涵盖了264辆汽油车、92辆混合动力车和27辆插电式混合动力/电动车。VED不仅记录了车辆的GPS轨迹,还包括燃料、能源、速度和辅助电力使用的时序数据。该数据集的创建旨在填补现有公开数据集中缺乏大规模时序燃料和能源数据的空白,为车辆能源消耗建模、驾驶员行为建模、机器学习和深度学习等研究提供支持。VED的发布得到了美国能源部的支持,并已在相关领域产生了广泛的影响。
当前挑战
VED数据集在构建过程中面临多个挑战。首先,数据收集涉及隐私保护问题,研究人员需确保在去识别化过程中不损失数据质量。其次,VED需要处理多种车辆类型和复杂的驾驶环境,包括城市道路、高速公路和交通密集的市中心区域,这增加了数据分析的复杂性。此外,VED还需应对不同季节和天气条件对车辆能源消耗的影响,以及如何在保护隐私的同时确保数据的可用性和准确性。这些挑战不仅涉及技术层面,还包括伦理和法律层面的考量,确保数据集的发布符合相关法规并尊重参与者的隐私权。
常用场景
经典使用场景
Vehicle Energy Dataset (VED) 的经典使用场景主要集中在车辆能源消耗研究领域。该数据集通过收集383辆个人汽车的GPS轨迹及其时间序列的燃料、能量、速度和辅助电力使用数据,为研究人员提供了丰富的实证数据。这些数据可用于分析不同驾驶条件下的能源消耗模式,如高速公路、城市交通密集区等,从而为优化车辆能源效率提供科学依据。
解决学术问题
VED 数据集解决了车辆能源消耗研究中的多个关键学术问题。首先,它填补了大规模时间序列燃料和能量数据公开可用性的空白,使得研究人员能够进行更精确的能源消耗建模。其次,通过提供真实世界的驾驶数据,VED 揭示了实验室测试与实际驾驶条件下能源消耗的显著差异,为改进车辆设计和驾驶策略提供了重要见解。此外,该数据集还支持驾驶员行为建模、交通模拟器校准、最佳路线选择模型等多方面的研究,推动了自动驾驶和智能交通系统的发展。
衍生相关工作
VED 数据集的发布催生了多项相关研究工作。例如,研究人员利用该数据集开发了数据驱动的车辆能源消耗模型,这些模型在预测和优化车辆能源效率方面表现出色。此外,VED 数据还被用于研究驾驶员行为对能源消耗的影响,以及如何通过智能驾驶技术(如Eco-driving技术)减少能源消耗。这些研究不仅推动了车辆能源效率的提升,也为自动驾驶和智能交通系统的发展提供了重要支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

中国光伏电站空间分布ChinaPV数据集(2015,2020年)

该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。

国家地球系统科学数据中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录