five

Waymo Open Dataset 和 Lyft Level 5 Dataset|自动驾驶数据集|交通安全数据集

收藏
arXiv2024-10-16 更新2024-10-18 收录
自动驾驶
交通安全
下载链接:
https://github.com/SaeedRahmani/Unsignalized_AV_HV
下载链接
链接失效反馈
资源简介:
本研究使用了Waymo Open Dataset和Lyft Level 5 Dataset,这两个数据集分别提供了约570小时和1000小时的驾驶数据,涵盖了多个城市的复杂交通场景。数据集包含了自动驾驶车辆和人类驾驶车辆的详细轨迹数据,用于分析两者在无信号交叉口的交互行为。数据集的创建过程包括数据预处理、场景识别和冲突分类,最终生成了一个高质量的冲突数据集,旨在促进对AV-HV交互的研究,特别是在提高交通安全和效率方面。
提供机构:
代尔夫特理工大学运输与规划系
创建时间:
2024-10-16
原始信息汇总

Unsignalized intersection 数据集概述

数据集维护者

  • Zhenlin (Gavin) Xu (https://github.com/Zhenlin-Xu)
  • Saeed Rahmani (https://github.com/SaeedRahmani)

数据集结构

  • 数据集以 pkl 格式存储冲突信息。

文件夹结构

bash pickles ├───lyft └───waymo

Waymo

  • 包含Waymo数据集的冲突信息。

Lyft

  • 包含Lyft数据集的冲突信息。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Waymo Open Dataset和Lyft Level 5 Dataset的构建基于大规模的真实世界驾驶数据,涵盖了多个城市和复杂的交通场景。数据集通过配备先进传感器(如LiDAR、雷达和摄像头)的自动驾驶车辆收集,提供了高分辨率的轨迹数据和详细的场景标签。这些数据经过系统化的预处理,包括去除噪声和异常值,以及识别和分类无信号交叉口的合并和交叉冲突,从而生成高质量的冲突数据集。
特点
这两个数据集的显著特点在于其广泛性和多样性,涵盖了从城市到郊区的多种驾驶环境。数据集不仅提供了详细的车辆轨迹和传感器数据,还包含了关键的安全和效率指标,如碰撞时间(TTC)、后侵入时间(PET)、最大所需减速度(MRD)等。此外,数据集还考虑了制造商特定的自动驾驶行为,为研究不同自动驾驶平台的行为差异提供了宝贵资源。
使用方法
Waymo Open Dataset和Lyft Level 5 Dataset可用于多种研究目的,包括但不限于自动驾驶算法优化、交通管理策略改进以及混合自动驾驶环境下的安全评估。研究者可以通过分析这些数据集中的车辆交互行为,深入理解自动驾驶车辆与人类驾驶车辆在无信号交叉口的行为差异和适应性。此外,数据集的高质量冲突数据为微观交通流模型的校准和自动驾驶系统的开发提供了重要支持。
背景与挑战
背景概述
自动驾驶车辆(AVs)的集成代表了交通系统中前所未有的机会,以增强道路安全和效率。然而,理解AVs与人类驾驶车辆(HVs)在交叉路口的互动仍然是一个开放的研究问题。Waymo Open Dataset和Lyft Level 5 Dataset通过提供大规模的AV数据,为研究这一复杂互动提供了宝贵的资源。这些数据集由Delft University of Technology的研究团队处理,旨在通过系统的方法识别和分析在无信号交叉路口的合并和交叉冲突,计算关键的安全和效率指标,如碰撞时间(TTC)、后侵占时间(PET)、最大所需减速度(MRD)、时间优势(TA)、速度和加速度分布。这些数据集的发布旨在促进对AV-HV互动的研究,特别是在复杂交通场景中的互动。
当前挑战
尽管Waymo Open Dataset和Lyft Level 5 Dataset提供了丰富的数据,但研究AVs与HVs在无信号交叉路口的互动仍面临诸多挑战。首先,这些数据集主要集中在城市驾驶场景,可能无法全面代表不同交通密度、道路类型或区域驾驶习惯的多样性。其次,尽管AVs在保持较大安全边际方面表现出色,但其保守行为可能导致人类驾驶员的意外反应,从而引发不安全情况。此外,不同制造商的AVs在行为上的显著差异,如Waymo和Lyft车辆的驾驶风格差异,增加了交通建模和管理策略的复杂性。最后,AVs的不可预测性可能导致人类驾驶员的误解和更高的风险,特别是在需要紧急制动的情况下。这些挑战突显了在确保AVs安全高效集成到现有交通系统中时,需要进一步的研究和改进。
常用场景
经典使用场景
Waymo Open Dataset 和 Lyft Level 5 Dataset 最经典的使用场景在于研究自动驾驶车辆(AVs)与人类驾驶车辆(HVs)在无信号交叉口的交互行为。通过分析这些数据集,研究者能够深入探讨AVs和HVs在复杂交通环境中的行为差异和适应性,特别是通过计算关键的安全和效率指标,如碰撞时间(TTC)、后侵入时间(PET)、最大所需减速度(MRD)、时间优势(TA)以及速度和加速度分布,从而全面理解AVs和HVs在无信号交叉口的行为特征。
衍生相关工作
基于Waymo Open Dataset 和 Lyft Level 5 Dataset,研究者们开展了一系列相关工作,包括但不限于微观交通流模型的校准、自动驾驶系统的开发以及交通管理策略的研究。这些工作不仅深化了对AVs和HVs交互行为的理解,还为自动驾驶技术的实际应用提供了重要的理论支持。例如,通过这些数据集,研究者们能够开发出更符合人类驾驶习惯的自动驾驶系统,从而提高公众对自动驾驶技术的接受度和信任度。
数据集最近研究
最新研究方向
在自动驾驶车辆(AVs)与人类驾驶车辆(HVs)的交互研究中,Waymo Open Dataset 和 Lyft Level 5 Dataset 提供了丰富的数据资源。最新研究聚焦于无信号交叉口的AVs与HVs的行为差异及适应性分析。通过系统方法,研究识别并分析了合并和交叉冲突,计算了关键的安全和效率指标,如碰撞时间(TTC)、后侵入时间(PET)、最大所需减速度(MRD)、时间优势(TA)、速度和加速度分布。研究发现,尽管AVs保持了较大的安全边际,但其保守行为可能导致人类驾驶员的意外反应,从而引发不安全状况。此外,Waymo和Lyft车辆的显著行为差异强调了在交通建模和管理策略中考虑制造商特定AV行为的重要性。
相关研究论文
  • 1
    Characterizing Behavioral Differences and Adaptations of Automated Vehicles and Human Drivers at Unsignalized Intersections: Insights from Waymo and Lyft Open Datasets代尔夫特理工大学运输与规划系 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

Global Solar Dataset

在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

music-genres-dataset

包含1494个音乐流派的数据集,每个流派有200首歌曲。每首歌曲提供以下属性:艺术家、歌曲名称、在列表中的位置、主流派、子流派(含流行度计数)、标签(非现有流派的标签,如情感等,也含流行度计数)。

github 收录

Adult Census Income dataset

该数据集由UCI机器学习库提供,包含个人的 demographic 信息及其收入水平。

github 收录