crowdsourced-vru-annotations

Hugging Face2025-09-18 更新2025-09-19 收录

下载链接：

https://huggingface.co/datasets/cklugmann/crowdsourced-vru-annotations

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个众包的脆弱道路用户(VRU)注释数据集，包含ECP和ZOD两个子数据集的表格注释。数据集关注于行人、骑行者、使用移动设备的人等脆弱道路用户，并为每个图像裁剪提供了多个注释者的回答。

创建时间：

2025-09-17

原始信息汇总

Crowdsourced VRU Annotations 数据集概述

数据集基本信息

许可证: CC-BY-SA-4.0
任务类别: 问答
语言: 英语
标签: 众包
数据集大小: 271,259,361 字节
下载大小: 93,553,083 字节

数据集结构

特征字段:
- id: 字符串类型，行的全局唯一标识符
- crop_id: 字符串类型，裁剪图像（边界框图像裁剪）的标识符
- question: 字符串类型，所提问题的标识符
- user_id: 字符串类型，标注者的标识符
- answer: 字符串类型，提交的答案；如果 cant_solve 为真则为 None / NaN
- cant_solve: 布尔类型，标注者是否将任务标记为无法解决
- created_at: 字符串类型，工作包处理时间的 ISO8601 时间戳
- duration_ms: int64 类型，任务的持续时间（毫秒）
- wp_id: 字符串类型，任务所属的工作包标识符
数据分割:
- ecp 分割: 1,035,840 个样本，233,586,835 字节
- zod 分割: 175,962 个样本，37,672,526 字节

数据集内容

领域: 弱势道路使用者（行人、骑自行车者、使用移动设备的人等）
数据类型: 表格标注行（答案），辅助 CSV 元数据文件

标注任务

ECP 任务（6个问题）:
- human being: 这是人类吗？
- statue/mannequin: 这是雕像或人体模型（即不是真人）吗？
- reflection of a person: 这是反射（例如在玻璃中）吗？
- on wheels: 这个人是在轮子上吗？
- on poster/picture/billboard: 这个人显示在海报/图片/广告牌上吗？
- on bike: 这个人是在自行车上吗？
ZOD 任务（1个问题）:
- human being: 这是人类吗？

数据集统计

ECP:
- 每个裁剪的任务数: 6
- 标注的裁剪数: 32,711
- 每个任务的重复次数: 5-12（自适应）
- 个体答案总数: 1,035,840
ZOD:
- 每个裁剪的任务数: 1
- 标注的裁剪数: 16,000
- 每个任务的重复次数: 11
- 个体答案总数: 175,962

元数据文件

ecp/boxes.csv:
- crop_id: 裁剪的唯一 ID（参考键）
- image_path: 裁剪所属的原始 ECP 图像的路径
- left, top, right, bottom: 边界框坐标（左上角和右下角）
zod/attributes.csv:
- crop_id: 裁剪的唯一 ID（参考键）
- label: 对象的原始 ZOD 标签
- attributes: 包含对象属性的字典
- left, top, width, height: 边界框坐标（左上角、宽度、高度）

数据来源

ECP 数据集: https://eurocity-dataset.tudelft.nl/
ZOD 数据集: https://zod.zenseact.com/

引用信息

bibtex @misc{liao2025minorityreportsbalancingcost, title={Minority Reports: Balancing Cost and Quality in Ground Truth Data Annotation}, author={Hsuan Wei Liao and Christopher Klugmann and Daniel Kondermann and Rafid Mahmood}, year={2025}, eprint={2504.09341}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2504.09341}, }

搜集汇总

数据集介绍

构建方式

在自动驾驶领域中，对弱势道路使用者的精确识别至关重要。该数据集通过众包标注方式构建，基于ECP和ZOD两个源数据集中的图像裁剪样本，针对每个裁剪区域设计二元选择题任务。ECP部分包含6个细粒度问题，ZOD部分聚焦于人类识别问题，采用自适应重复标注策略——ECP任务根据标注分歧程度动态分配5-12次重复标注，ZOD任务则固定进行11次标注。所有标注任务以工作包形式组织，确保标注过程的系统性和可追溯性。

特点

该数据集的核心价值在于其多层次标注体系与质量控制机制。每个标注样本包含唯一标识符、问题类型、用户ID、回答内容和时间元数据，并特别设置无法解答标志位以处理边缘案例。数据集提供两个独立子集：ECP子集包含103万余条标注记录，涵盖人像真实性、交通工具类型等六维度语义信息；ZOD子集聚焦人类识别任务，包含17万余条标注数据。配套的元数据文件提供原始图像路径、边界框坐标及物体属性等辅助信息，形成完整的标注生态系统。

使用方法

研究者可通过Hugging Face数据集库直接加载标注表格，使用load_dataset函数分别获取ecp和zod两个分片的Dataset对象。辅助元数据文件需通过hf_hub_download接口下载，再利用pandas进行解析。建议采用基于crop_id的手动关联策略，将标注记录与对应的图像元数据进行匹配，这种设计既保持数据完整性又赋予研究者充分的处理灵活性。典型工作流程包括：加载标注数据至数据框架，获取边界框元数据，执行自定义关联操作，最终构建适用于机器学习模型训练的多模态数据集。

背景与挑战

背景概述

随着自动驾驶技术的快速发展，对道路弱势群体（VRU）的精确识别成为计算机视觉领域的关键挑战。crowdsourced-vru-annotations数据集由研究团队于2025年创建，基于欧洲城市行人数据集（ECP）和Zenseact开放数据集（ZOD），专注于通过众包标注方式提升VRU识别的可靠性。该数据集通过多轮标注策略和自适应分配机制，显著提升了标注质量，为自动驾驶系统中的行人检测与分类研究提供了重要数据支撑，推动了智能交通系统安全性的标准化评估进程。

当前挑战

该数据集致力于解决道路弱势群体识别中的标注一致性与可靠性问题，核心挑战在于众包标注中固有的主观差异和标注噪声。构建过程中面临多重困难：首先需要设计高效的自适应标注分配算法以处理标注者间的高分歧案例；其次需协调ECP和ZOD两大异构数据源的标注规范统一；此外还需克服大规模标注任务中出现的并发控制、时间约束和质量监控等工程挑战，确保百万级标注数据的时空一致性与可追溯性。

常用场景

经典使用场景

在自动驾驶系统的感知模块验证中，该数据集通过众包标注方式为VRU识别任务提供高质量基准数据。研究者利用其多标注者重复标注特性，可构建概率性标签分布模型，评估不同标注策略对模型训练的影响。典型应用包括开发鲁棒性行人检测算法，通过分析标注者间一致性程度来优化置信度校准机制。

衍生相关工作

基于该数据集衍生了多项标注质量评估的经典研究，包括自适应标注分配算法、标注者可靠性建模框架以及噪声标签学习方法的改进。这些工作推动了众包标注理论的发展，特别是在计算机视觉领域建立了新的标注效率与质量平衡范式，为后续大规模标注项目提供了方法论指导。

数据集最近研究