five

OnSiteVRU|智能交通系统数据集|自动驾驶数据集

收藏
arXiv2025-03-30 更新2025-04-03 收录
智能交通系统
自动驾驶
下载链接:
https://www.kaggle.com/datasets/zcyan2/mixed-traffic-trajectory-dataset-in-from-shanghai
下载链接
链接失效反馈
资源简介:
OnSiteVRU数据集是由同济大学教育部道路与交通工程重点实验室与同济大学交通运输工程学院共同开发的高分辨率轨迹数据集,包含多种场景如交叉口、路段和城中村等。该数据集提供了机动车、电动自行车和人力自行车的轨迹数据,总计约17429条轨迹,精确到0.04秒。数据集整合了俯视图自然驾驶数据和车载实时动态检测数据,以及交通信号、障碍物和实时地图等环境信息,能够全面重建交互事件。该数据集在易受伤害的道路使用者密度和场景覆盖范围方面优于传统数据集,为交通流建模、轨迹预测和自动驾驶虚拟测试提供了关键支持。
提供机构:
同济大学教育部道路与交通工程重点实验室 & 同济大学交通运输工程学院
创建时间:
2025-03-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
OnSiteVRU数据集的构建采用了多源感知技术和高精度传感器,包括LiDAR和摄像头,以捕捉复杂交通场景中的微观行为。数据采集地点覆盖了多种典型中国交通场景,如交叉口、路段和城中村,确保了场景的代表性和多样性。通过计算机视觉算法(如YOLOv7和DeepSORT)进行目标检测和轨迹跟踪,并结合高精度地图和交通信号数据,实现了对交通参与者行为的全面记录。数据采集时间集中在非机动车流量高峰时段,进一步增强了数据的实用性和真实性。
特点
OnSiteVRU数据集以其高密度和多样性的弱势道路使用者(VRU)轨迹数据著称,涵盖了机动车、电动自行车和人力自行车等多种交通参与者。数据精度高达0.04秒,提供了丰富的微观行为信息,支持详细的交通流建模和风险分析。此外,数据集还整合了交通信号、障碍物和实时地图等环境信息,能够全面重构交互事件,为复杂场景下的行为研究提供了高价值数据。与现有数据集相比,OnSiteVRU在VRU密度和场景覆盖范围上具有显著优势。
使用方法
OnSiteVRU数据集适用于交通流建模、轨迹预测和自动驾驶虚拟测试等多种研究场景。用户可通过Kaggle平台下载数据集,并利用其标准化格式(包括轨迹数据、交通信号状态和高清地图)进行算法开发和验证。数据集还支持在线挑战赛形式,参与者可通过离线部署算法预测缺失轨迹,并提交结果至在线平台进行评估。这种开放和透明的评估机制为自动驾驶算法的优化提供了重要参考。
背景与挑战
背景概述
OnSiteVRU数据集由同济大学交通工程学院的研究团队于2025年开发,旨在解决混合交通流中弱势道路使用者(VRUs,如行人和骑行者)的安全问题。随着城市化进程的加速和交通需求的增长,VRUs在复杂交通环境中的行为多样性和动态性成为研究重点。该数据集通过高精度传感器和多源数据融合技术,覆盖了交叉口、路段和城中村等多种场景,提供了包括机动车、电动自行车和人力自行车在内的约17,429条轨迹数据,时间精度达0.04秒。OnSiteVRU不仅集成了俯视视角的自然驾驶数据和车载实时动态检测数据,还包含交通信号、障碍物和实时地图等环境信息,为交通流建模、轨迹预测和自动驾驶虚拟测试提供了关键支持。
当前挑战
OnSiteVRU数据集面临的挑战主要体现在两个方面:领域问题和构建过程。在领域问题方面,现有数据集难以全面捕捉VRUs在复杂交通环境中的多样性和动态行为,尤其是在极端天气、夜间或高密度交通区域的场景覆盖不足。此外,数据集中特殊群体(如儿童、老年人)或非典型行为(如突然奔跑、乱穿马路)的覆盖有限,限制了自动驾驶系统在现实场景中的应用效果。在构建过程中,高精度的VRU数据采集成本高昂,尤其是在复杂场景中;数据标注的复杂性和主观性可能引入误差,影响模型训练效果;隐私保护问题也限制了数据的开放和共享规模。这些挑战需要通过技术创新和场景适配来逐步解决。
常用场景
经典使用场景
OnSiteVRU数据集在混合交通流研究中展现了其经典应用价值,特别是在高密度复杂交通场景下的微观行为分析。该数据集通过整合多源感知技术,如计算机视觉算法和高精度雷达,捕捉了包括机动车、电动自行车和人力自行车在内的多种交通参与者的轨迹信息。其高时间分辨率(0.04秒)和空间覆盖范围(如交叉口、路段和城中村)使其成为研究交通流动态交互、冲突风险建模以及自动驾驶算法验证的理想选择。数据集的独特之处在于其不仅提供了俯视视角的自然驾驶数据,还融合了车载实时动态检测数据,从而全面重构了交通参与者的交互事件。
解决学术问题
OnSiteVRU数据集有效解决了混合交通流研究中VRU行为多样性与动态性表征不足的学术难题。传统数据集在VRU场景覆盖和数据质量上存在显著缺陷,难以支持复杂交通环境下的安全研究。该数据集通过高精度轨迹数据(如速度、加速度、加加速度等多维参数),为微观行为建模(如变道决策、加减速模式)和宏观交通流分析提供了基础。其包含的信号状态信息与轨迹数据的耦合,进一步解决了信号控制环境下VRU行为量化分析的瓶颈,为自动驾驶协同决策和交通冲突诊断提供了理论支撑。
衍生相关工作
围绕OnSiteVRU数据集,已衍生出多项经典研究工作。在轨迹预测领域,基于其多模态数据开发的生成对抗网络(GAN)模型显著提升了遮挡场景下的轨迹补全精度;在风险分析方面,学者利用数据集的冲突分布特征构建了混合交通流冲突概率模型,为交叉口信号优化提供了新方法。此外,数据集还推动了车载感知算法的改进,如结合YOLOv7和DeepSORT的实时多目标跟踪框架,其性能在数据集的复杂场景中得到了验证。这些工作进一步拓展了数据集在自动驾驶安全评估和智能交通系统中的影响力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录