five

EuroCity Persons

收藏
arXiv2025-09-30 收录
下载链接:
https://eurocity-dataset.tudelft.nl/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为EuroCity Persons,包含了来自12个欧洲国家的31个城市中,关于城市交通场景下行人、骑行者及其他骑行人员的极高多样性、精确且详尽的标注数据。该数据集不仅规模庞大,还特别提供了超过211,200个人物朝向的标注信息,旨在为各种前沿的深度学习方法在目标检测任务上提供一个基准测试。具体而言,该数据集包含了超过238,200个人物实例,分布在47,300多张图像中,其任务重点在于对象检测。

The dataset is named EuroCity Persons. It contains highly diverse, precise and detailed annotated data for pedestrians, cyclists and other riders in urban traffic scenarios, collected from 31 cities across 12 European countries. Besides its large scale, this dataset specifically provides over 211,200 annotations of person orientations, aiming to serve as a benchmark for various state-of-the-art deep learning methods in object detection tasks. Specifically, this dataset includes more than 238,200 person instances distributed across over 47,300 images, with the task focusing on object detection.
搜集汇总
数据集介绍
main_image_url
构建方式
EuroCity Persons数据集的构建过程体现了严谨的科学方法论。该数据集通过车载移动平台在12个欧洲国家的31个城市中采集图像,采用每80帧抽取一帧的稀疏采样策略以降低选择偏差。所有标注均通过人工手动完成,未使用自动化辅助工具,确保了标注的独立性与准确性。标注内容不仅包含行人、骑行者等目标的紧密包围框,还详细记录了遮挡程度、截断状态、整体朝向以及骑行工具类型等多维度信息。数据划分采用基于时空连续性的策略,将各城市记录按时间分块后以60%、10%、30%的比例分配至训练、验证和测试集,有效避免了同一物理个体在不同子集中的重复出现。
特点
EuroCity Persons数据集的核心特点在于其前所未有的规模、多样性与标注精细度。该数据集包含超过47,300张图像和238,200个人体实例,其标注规模较先前基准数据集提升近一个数量级。地理覆盖范围横跨欧洲12国,采集条件涵盖昼夜、四季及多种天气状况,极大增强了数据的场景多样性。标注细节方面,除常规包围框外,还提供了超过211,200个朝向标注以及遮挡、截断、骑行工具分类等丰富属性标签。数据集特别包含了夜间场景与高密度人群图像,为检测模型在复杂光照、严重遮挡等挑战性条件下的性能评估提供了宝贵资源。
使用方法
该数据集主要用于城市交通场景下行人及骑行者检测任务的基准测试与算法研发。研究者可利用其提供的训练集与验证集进行模型训练与调优,并通过在线评估服务器对测试集性能进行标准化评测。数据集支持针对不同难度子集(如‘合理’、‘小尺寸’、‘遮挡’)的专项评估,并允许在评测中灵活处理邻近类别与忽略区域。其丰富的多维度标注支持联合检测与朝向估计等多任务学习,而严格划分的时空独立子集确保了评测结果的可靠性。该数据集已成功用于分析训练数据规模、地理偏差、昼夜差异等因素对检测性能的影响,为计算机视觉领域提供了深入洞察算法泛化能力的实验平台。
背景与挑战
背景概述
EuroCity Persons数据集于2018年由戴姆勒集团环境感知团队与代尔夫特理工大学智能车辆组联合推出,旨在为城市交通场景中的行人、骑行者等目标检测任务提供大规模、高多样性的基准数据。该数据集通过在12个欧洲国家的31个城市中采集车载图像,涵盖昼夜、四季及多种天气条件,包含超过23.8万个人实例标注与4.7万余张图像,其规模较先前同类数据集提升近一个数量级。核心研究聚焦于提升自动驾驶系统中行人检测的鲁棒性与泛化能力,通过提供精细的边界框、遮挡程度及身体朝向标注,推动了深度学习模型在复杂真实场景下的性能边界,成为计算机视觉领域的重要基准之一。
当前挑战
EuroCity Persons数据集致力于解决城市交通场景中多类别目标(行人、骑行者等)的检测问题,其核心挑战在于应对目标外观的高度多样性,如衣着变化、姿态差异、光照条件(昼夜)及复杂遮挡。数据构建过程中,需克服大规模跨地域采集带来的标注一致性难题,包括在不同气候与文化环境下保持标注精度,以及处理夜间低对比度、运动模糊等低质量图像。此外,确保超过21万个人体朝向标注的空间准确性,并在数十万实例中维持低于1%的漏标与误标率,对质量控制流程提出了极高要求。
常用场景
经典使用场景
在计算机视觉领域,EuroCity Persons数据集作为行人检测任务的重要基准,其经典使用场景聚焦于评估和优化深度学习模型在复杂城市交通环境中的性能。该数据集通过覆盖欧洲12个国家31个城市的多样化场景,包括昼夜变化、季节更替及多种天气条件,为研究者提供了丰富的训练与测试样本。典型应用包括利用Faster R-CNN、YOLOv3等先进算法进行行人、骑行者的边界框检测与方向估计,以推动自动驾驶系统中感知模块的精准度提升。
衍生相关工作
基于EuroCity Persons数据集,学术界衍生了一系列经典研究工作。例如,多项研究利用该数据集验证了数据规模与多样性对检测性能的增益效应,深化了对深度学习模型数据依赖性的理解。同时,数据集被用于探索多任务学习框架,如结合检测与方向估计的Pose-RCNN等模型优化。此外,该数据集还促进了跨数据集泛化能力的分析,推动了针对地理偏差、昼夜差异等现实挑战的算法改进,为后续大规模场景理解数据集的构建提供了方法论参考。
数据集最近研究
最新研究方向
在自动驾驶与计算机视觉领域,EuroCity Persons数据集作为大规模、高多样性的行人检测基准,正推动着前沿研究的深入发展。当前研究聚焦于利用该数据集探索数据驱动的性能提升机制,特别是在跨域泛化、夜间检测与多任务学习等方面。通过预训练与微调策略,该数据集显著提升了模型在KITTI和CityPersons等现有基准上的表现,揭示了地理与时域偏差对检测性能的影响。同时,结合生成对抗网络(GAN)与多尺度特征融合技术,研究致力于解决小目标、遮挡及复杂光照条件下的检测难题,为全自动驾驶系统中高精度感知模块的演进提供了关键数据支撑。
相关研究论文
  • 1
    The EuroCity Persons Dataset: A Novel Benchmark for Object Detection戴姆勒集团 · 2018年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作