five

Nexar Dashcam Collision Prediction Dataset|交通事故分析数据集|自动驾驶数据集

收藏
arXiv2025-03-06 更新2025-03-08 收录
交通事故分析
自动驾驶
下载链接:
https://huggingface.co/datasets/nexar-ai/nexar collision prediction
下载链接
链接失效反馈
资源简介:
Nexar Dashcam Collision Prediction Dataset是由Nexar Inc.创建的,包含1500个标注视频片段的交通事件分析数据集。每个视频大约40秒长,涵盖各种真实世界交通场景。视频被标注为碰撞/几乎碰撞与正常驾驶。数据集还包含环境条件(光照条件和天气)以及场景类型(城市、乡村、高速公路等)的标注。为碰撞和几乎碰撞案例提供了额外的时间标注,包括事件发生的精确时刻和预警时间。此数据集旨在支持交通事故分析和自动驾驶车辆安全研究。
提供机构:
Nexar Inc.
创建时间:
2025-03-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
Nexar Dashcam Collision Prediction Dataset 是由 Nexar Inc. 构建的数据集,旨在支持交通事件分析、碰撞预测和自动驾驶安全的研究。该数据集包含 1,500 个标注的视频片段,每个片段约 40 秒长,捕捉了各种真实世界的交通场景。视频片段被标注为事件类型(碰撞/近碰撞 vs. 正常驾驶)、环境条件(光照条件和天气)和场景类型(城市、乡村、高速公路等)。对于碰撞和近碰撞案例,还提供了额外的时标标签,包括事件的精确时刻和预警时间,标记碰撞首次变得可预测的时刻。该数据集的构建基于 Nexar 行车记录仪记录的真实世界交通场景,通过专业的标注团队进行标注,确保了数据集的质量和多样性。
特点
Nexar Dashcam Collision Prediction Dataset 的特点包括:1. 视频片段数量多,每个片段约 40 秒长,提供了丰富的时序上下文。2. 视频片段被标注为事件类型、环境条件和场景类型,方便研究人员进行多方面的分析。3. 对于碰撞和近碰撞案例,提供了额外的时标标签,包括事件的精确时刻和预警时间,有助于研究人员进行更精确的预测。4. 数据集包含了各种真实世界的交通场景,包括不同的天气、光照和道路类型,以及行车记录仪捕捉到的各种效果,如反射、运动模糊、雾和镜头眩光等。
使用方法
使用 Nexar Dashcam Collision Prediction Dataset 进行研究时,研究人员可以按照以下步骤进行:1. 下载数据集并解压。2. 根据研究需求,对数据集进行预处理,如视频分割、特征提取等。3. 使用标注信息进行模型训练和评估,如使用平均精度(AP)计算多个时间间隔的平均精度,以评估模型的预测性能。4. 在 Kaggle 平台上参加 Nexar Dashcam Collision Prediction Challenge,与其他研究者进行比较和交流。
背景与挑战
背景概述
在自动驾驶和高级驾驶辅助系统(ADAS)的快速发展中,交通事件的预测与分析显得尤为重要。Nexar Dashcam Collision Prediction Dataset 是由 Nexar Inc. 的 Daniel C. Moura、Shizhan Zhu 和 Orly Zvitia 等研究人员于 2025 年创建的数据集。该数据集旨在推动交通事故分析、碰撞预测以及自动驾驶车辆安全性的研究。数据集包含 1,500 个标注的视频片段,每个视频约 40 秒长,捕捉了各种真实世界的交通场景。视频被标注为事件类型(碰撞/接近碰撞与正常驾驶)、环境条件(光照条件和天气)以及场景类型(城市、乡村、高速公路等)。对于碰撞和接近碰撞案例,还提供了额外的时标标签,包括事件的精确时刻和警报时间,即碰撞首次可预测的时刻。Nexar Dashcam Collision Prediction Challenge 的引入旨在通过该数据集促进事故预测研究。参与者需要开发机器学习模型,以预测给定输入视频的即将发生碰撞的可能性。模型性能通过在事件前多个时间间隔(即事件前 500 毫秒、1000 毫秒和 1500 毫秒)计算的平均精度(AP)进行评估,强调早期和可靠预测的重要性。该数据集在开放许可下发布,但限制不道德的使用,确保负责任的研究和创新。
当前挑战
Nexar Dashcam Collision Prediction Dataset 面临着一系列挑战。首先,事故预测的在线性质要求系统在事件发生之前进行预测,这比事故检测更具挑战性。其次,预测的准确性以及预测时间都非常关键,因为预测过晚可能导致预测无效。此外,确定何时可以预测事故以及何时应采取预防措施的主观性也是数据集构建中的一个挑战。为了解决这些问题,数据集采用了多标注者提供的时间标签,以减少主观性。另一个挑战是数据集的多样性,包括各种光照条件、天气状况、道路类型以及相机相关的伪影,如反射、运动模糊、雾和镜头眩光。这些因素使得数据集成为一个更具挑战性的测试平台,但同时也为模型提供了更丰富的特征空间,有助于区分可靠的预测线索。最后,数据集还面临隐私和数据安全的挑战,因此在发布前对视频进行了匿名化处理,包括模糊处理面部、车牌和仪表盘,移除音频,并排除可能揭示敏感位置的短片段。
常用场景
经典使用场景
Nexar Dashcam Collision Prediction Dataset is a comprehensive collection of 1,500 annotated video clips, each approximately 40 seconds long, capturing a diverse range of real-world traffic scenarios. These videos are labeled with event types (collision/near-collision vs. normal driving), environmental conditions (lighting conditions and weather), and scene types (urban, rural, highway, etc.). For collision and near-collision cases, additional temporal labels are provided, including the precise moment of the event and the alert time, marking when the collision first becomes predictable. This dataset is ideal for training machine learning models that predict the likelihood of an imminent collision given an input video, thereby aiding in the development of autonomous driving systems and Advanced Driver Assistance Systems (ADAS).
实际应用
The practical application of this dataset extends beyond academic research. It is a powerful tool for developers of autonomous vehicles and ADAS systems to test and improve their models in real-world traffic scenarios. The temporal annotations and the diverse range of environmental and scene conditions make it possible to evaluate the performance of these systems under various circumstances. This can lead to the development of more reliable and efficient systems that can anticipate and prevent accidents, thereby enhancing traffic safety.
衍生相关工作
The Nexar Dashcam Collision Prediction Dataset has inspired several related works in the field of traffic accident anticipation. Researchers have used this dataset to develop and evaluate various machine learning models, such as the Traffic Transformer framework for temporal traffic accident prediction, and the Viena dataset for driving anticipation. These works have contributed to the advancement of accident prediction and prevention technologies, thereby enhancing traffic safety and promoting the development of autonomous vehicles.
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Movies Dataset

这个数据集包含电影的详细信息,包括电影名称、评分、类型、年份、发布日期、IMDb评分、投票数、导演、编剧、主演、制作国家、预算、总收入、制作公司和电影时长。

github 收录