five

SamaAI/sama-drives-california

收藏
Hugging Face2023-06-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SamaAI/sama-drives-california
下载链接
链接失效反馈
官方服务:
资源简介:
sama-drives-california数据集是一个目标检测数据集,包含25,136帧由车载摄像头在加利福尼亚拍摄的图像,分辨率为848x480像素,帧率为1 FPS,覆盖了超过7小时的驾驶时间。数据集中的图像按照bdd100k格式保存,每帧图像包含时间、天气等属性标签,以及目标物体的边界框和多边形标注。数据集主要用于目标检测任务,标注了车辆、行人、可驾驶区域、车道、交通灯和交通标志等对象。数据集还提供了可视化工具和视频格式的下载链接,并详细说明了标注的规则和限制。

sama-drives-california数据集是一个目标检测数据集,包含25,136帧由车载摄像头在加利福尼亚拍摄的图像,分辨率为848x480像素,帧率为1 FPS,覆盖了超过7小时的驾驶时间。数据集中的图像按照bdd100k格式保存,每帧图像包含时间、天气等属性标签,以及目标物体的边界框和多边形标注。数据集主要用于目标检测任务,标注了车辆、行人、可驾驶区域、车道、交通灯和交通标志等对象。数据集还提供了可视化工具和视频格式的下载链接,并详细说明了标注的规则和限制。
提供机构:
SamaAI
原始信息汇总

数据集概述

名称: sama-drives-california

类型: 对象检测数据集

规模: 包含25,136帧,每帧848x480像素,覆盖超过7小时的驾驶视频。

数据结构:

  • 文件命名: 视频编号-帧索引.jpg(例如:099-002.jpg)
  • 标签系统: 使用label:id标识视频中的唯一对象,不跨视频共享。

数据特征:

  • 基本特征:
    • fname: 文件名,字符串类型
    • path: 文件路径,字符串类型
    • label: 结构化标签,包含多个子特征
  • 标签详细特征:
    • timeofday: 时间段,字符串类型
    • weather: 天气状况,字符串类型
    • drivingConditions: 驾驶条件(仅限车辆),字符串类型
    • laneChange: 车道变更(仅限车道),字符串类型
    • occluded: 遮挡状态,布尔类型
    • box2d: 二维边界框,包含x1, x2, y1, y2,均为int64类型
    • poly2d: 二维多边形,包含closed, filled, vertices,其中vertices为int64序列
    • category: 类别,字符串类型
    • id: 对象ID,int64类型
    • manualAttributes: 手动属性标注,布尔类型
    • manualShape: 手动形状标注,布尔类型

数据分割:

  • 训练集: 25,136个样本,总大小1,088,252,764.96字节

许可证: CC BY 4.0

数据集详细结构

标签结构:

  • 时间段分类: Day, Night, Dusk/Dawn/Twilight
  • 天气分类: Sunny, Cloudy, Rainy, Snowy, Other
  • 驾驶条件分类: Light Traffic, Moderate Traffic, Heavy Traffic
  • 车道变更分类: Current, Alternate, Opposite

对象分类:

  • 车辆: Car, Truck, Van, SUV, Bus, Other LV, Bicycles, Motorbikes
  • 人物: Pedestrians
  • 区域: Drivable Space
  • 车道: Current Lane, Alternate Lane, Opposite Lane
  • 交通设施: Traffic Lights, Traffic Signs

注释规则:

  • 忽略宽度或高度小于10像素的对象
  • 标注时允许2像素的误差
  • 对于机动车辆,包括后视镜但不包括天线
  • 对于自行车,包括骑车人
  • 对于摩托车,包括骑手
  • 对于交通灯,标注围绕灯具但不包括杆
  • 对于交通标志,不包括杆或结构

数据集使用

可视化: 可通过FiftyOne应用进行数据集的可视化,需要下载并解压数据集文件。

视频格式: 数据集还提供视频格式,包含视频文件和FiftyOne标签,可通过FiftyOne应用进行处理。

搜集汇总
数据集介绍
main_image_url
构建方式
在自动驾驶视觉感知领域,高质量的数据集是算法研发的基石。SamaAI/sama-drives-california数据集的构建源于对真实驾驶场景的系统性采集与精细化标注。该数据集通过车载摄像头在加利福尼亚州的实际道路环境中以1帧/秒的速率连续录制,从中抽取了总计25,136帧分辨率为848x480的图像,覆盖超过7小时的驾驶时长。为确保数据质量与隐私安全,采集过程中剔除了包含敏感信息或长时间静止的无意义片段。所有标注工作均由专业团队遵循严格的规范完成,例如忽略尺寸小于10像素的物体,并对车牌、人脸等敏感信息进行了模糊处理,最终形成了符合BDD100K格式的结构化数据集。
使用方法
为便于研究者高效利用该数据集进行算法开发与评估,其提供了灵活多样的使用途径。数据集以标准的BDD100K格式组织,用户可直接通过FiftyOne等专业工具加载与可视化,快速浏览标注结果并进行数据分析。对于目标检测与实例分割任务,开发者可便捷地读取`box2d`字段中的边界框坐标以及`poly2d`字段中的多边形顶点序列。数据集同时提供了视频格式版本,支持以连续帧序列进行分析,有助于研究时序上下文信息。在具体应用中,用户需注意标注字段的完整性,例如`drivingConditions`和`laneChange`等属性并非在所有实例中都存在,需在预处理阶段进行相应处理。
背景与挑战
背景概述
自动驾驶技术作为人工智能领域的前沿方向,其发展高度依赖于大规模、高质量的道路场景数据集。SamaAI/sama-drives-california数据集由Sama公司构建,旨在为计算机视觉与自动驾驶研究提供丰富的真实世界驾驶场景标注数据。该数据集采集于加州道路,包含超过2.5万帧仪表盘摄像头图像,覆盖昼夜、多种天气及交通状况,并以BDD100K格式提供精细的边界框与多边形标注,涵盖车辆、行人、可行驶区域等多类目标。其创建不仅推动了目标检测与场景理解算法的进步,也为模型在复杂动态环境中的鲁棒性评估提供了关键基准。
当前挑战
该数据集致力于解决自动驾驶场景中目标检测与语义分割的挑战,其核心难点在于处理真实驾驶环境的复杂性与多样性。具体而言,挑战体现在两方面:其一,领域问题层面,模型需在多变光照、天气条件及部分遮挡下准确识别并定位多尺度目标,如远处小尺寸车辆或密集交通中的重叠物体;其二,构建过程层面,数据标注面临高精度要求,需在像素级容忍度内勾勒目标轮廓,同时确保跨视频帧的对象ID一致性,且为保护隐私而进行的车牌与人脸模糊处理亦可能引入信息损失,影响模型学习细节特征的能力。
常用场景
经典使用场景
在自动驾驶视觉感知领域,SamaAI/sama-drives-california数据集为研究者提供了丰富的真实世界驾驶场景数据。该数据集以其高精度的边界框与多边形标注,成为训练和评估目标检测与实例分割模型的经典资源。通过涵盖多种天气条件、光照环境及交通状况,它能够有效模拟复杂多变的驾驶环境,助力模型在动态场景中实现鲁棒性识别。
解决学术问题
该数据集针对自动驾驶研究中环境感知的泛化能力不足问题提供了解决方案。其精细的标注体系,包括车辆、行人、可行驶区域及交通标志等多类别对象,支持对遮挡、尺度变化及复杂背景等挑战性视觉任务的深入探索。通过提供连续帧序列与对象跟踪标识,数据集进一步促进了时序分析与行为预测等前沿课题的研究,推动了端到端感知系统的学术进展。
实际应用
在实际应用中,该数据集被广泛用于自动驾驶系统的开发与测试环节。汽车制造商与科技公司利用其标注数据训练感知算法,以提升车辆在真实道路中对周围环境的理解能力。数据集涵盖的多样化场景,如昼夜转换、雨雪天气及不同交通密度,有助于优化系统在边缘案例下的性能,为高级驾驶辅助系统(ADAS)和全自动驾驶技术的落地提供了关键的数据支撑。
数据集最近研究
最新研究方向
在自动驾驶领域,高质量的道路场景数据集是推动感知算法发展的关键基石。SamaAI/sama-drives-california数据集以其丰富的时空标注信息,包括多类车辆、行人、可行驶区域及交通标志的边界框与多边形标注,正成为研究复杂动态环境下目标检测与实例分割算法的重要资源。当前前沿研究聚焦于利用其连续帧序列与对象ID追踪特性,探索时序一致性建模与长尾类别识别问题,以提升模型在真实世界多变天气与光照条件下的鲁棒性。该数据集与BDD100K格式的兼容性,进一步促进了跨数据集联合训练与领域自适应方法的热点探索,对推动端到端自动驾驶系统的环境理解能力具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作