five

CrowdSim2

收藏
arXiv2023-04-11 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.7262220
下载链接
链接失效反馈
官方服务:
资源简介:
CrowdSim2是由西里西亚工业大学开发的用于人和车辆检测的合成数据集,基于Unity图形引擎的模拟器生成。该数据集包含数千个视频片段,涵盖多种天气条件和对象密度,用于精确的对象定位。数据集的创建过程自动化,无需人工标注,有效降低了成本。CrowdSim2主要应用于计算机视觉领域,特别是在需要复杂场景和隐私保护的数据标注任务中,为深度学习模型提供了一个受控的测试环境。

CrowdSim2 is a synthetic dataset for human and vehicle detection, developed by Silesian University of Technology and generated via a simulator based on the Unity graphics engine. This dataset comprises thousands of video clips spanning diverse weather conditions and object densities, tailored for accurate object localization. The entire dataset creation process is fully automated, eliminating the need for manual annotation and effectively reducing costs. CrowdSim2 is primarily utilized in the field of computer vision, particularly in data annotation tasks requiring complex scenarios and privacy protection, serving as a controlled test environment for deep learning models.
提供机构:
西里西亚工业大学
创建时间:
2023-04-11
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,数据稀缺性常成为监督学习模型发展的桎梏,尤其是对于行人与车辆检测等复杂任务。为突破这一瓶颈,CrowdSim2数据集应运而生,其构建依托于基于Unity图形引擎的扩展版CrowdSim模拟器。该模拟器采用智能体驱动范式,每个行人或车辆均被独立控制,并依据环境做出诸如行走、奔跑、握手等行为决策。研究人员精心设计了四种城市场景(含交通路口、公园、老城广场及隧道),并借助多视角摄像头录制了数千段30秒、分辨率为800×600像素的视频片段。标注过程完全自动化,通过模拟器直接生成符合MOTDet Challenge标准的边界框,精准定位人与车辆两类目标,彻底免除了人工标注的繁琐与偏差。
特点
该数据集最显著的特点在于其可控性与多样性。研究人员系统性地调控了四大天气条件(晴天、雨天、雾天、雪天)以及场景中目标的密度(从单个物体到数百个物体),从而构建出一个高度仿真的受控测试环境。总计采集超过7,800段视频剪辑,提取出逾580万帧图像,为评估检测器在不同光照、遮挡及拥挤程度下的鲁棒性提供了海量素材。此外,模拟器的开放性使得未来可轻松扩展新场景与行为模式,相较于基于GTA V等商业游戏生成的数据集,CrowdSim2在定制化与因子控制方面展现出无可比拟的灵活性。
使用方法
CrowdSim2专为行人及车辆检测任务设计,尤其适合作为模型性能评估的受控测试基准。使用者可直接从Zenodo仓库下载数据集,其中包含已标注边界框的静态帧图像。在论文的示范性实验中,研究者选取了YOLOv5与YOLOv7系列的不同变体,以COCO数据集预训练后,在CrowdSim2上按天气与密度两个维度分组测试。评估指标采用MS COCO标准中的AP@0.5,通过对比不同条件下的平均精度,可清晰揭示检测器在恶劣天气或高密度场景下的性能衰减。该数据集亦可拓展至目标计数、多目标跟踪及行为识别等下游任务,为算法在受控环境中的可靠性验证提供坚实支撑。
背景与挑战
背景概述
在计算机视觉领域,深度学习模型的卓越性能高度依赖于大规模、高质量标注数据的支撑。然而,真实世界数据的采集与标注往往面临隐私保护、人力成本高昂及罕见场景覆盖不足等固有限制,数据稀缺已成为制约监督学习模型发展的关键瓶颈。为应对这一挑战,CrowdSim2数据集于2023年由波兰西里西亚理工大学联合意大利国家研究委员会等机构共同提出,旨在通过合成数据为行人及车辆检测任务提供可控、可复现的标准化测试基准。该数据集基于Unity图形引擎构建的仿真器生成,涵盖晴天、雨、雾、雪四种天气条件及从稀疏到密集的多种目标密度场景,包含逾七百万帧标注图像。其核心研究问题在于验证合成场景能否作为评估目标检测器在受控环境下性能的有效工具,并揭示模型在不同环境因素下的鲁棒性差异。CrowdSim2的发布为领域内提供了一种低成本、无隐私风险的替代性评估方案,尤其适用于极端或罕见场景下的算法压力测试。
当前挑战
CrowdSim2所面临的挑战主要体现为双重维度。其一,在领域问题层面,当前目标检测模型在真实世界部署中常因环境变化(如恶劣天气、目标密集遮挡)导致性能显著退化,而现有真实数据集难以系统性地覆盖这些非典型但关键的场景;CrowdSim2虽能模拟多样条件,但合成数据与真实数据间的域差异仍是阻碍其直接迁移应用的核心难题。其二,在构建过程中,尽管仿真器可自动生成标注,但确保合成场景的物理真实性与行为合理性(如行人交互、车辆运动规则)需精细设计;同时,在控制天气、密度等变量时,如何避免场景间非目标因素的混淆干扰,以及如何平衡数据规模与渲染计算成本,均是构建过程中必须克服的技术挑战。
常用场景
经典使用场景
CrowdSim2作为基于Unity图形引擎生成的合成数据集,在城市监控与人群分析领域开辟了新的测试范式。其经典使用场景聚焦于行人及车辆的目标检测任务,通过模拟晴天、雨、雾、雪等多种天气条件,以及从稀疏到密集的物体分布,为研究者提供了一个可精确控制变量、完全标注的受控实验环境。该数据集尤其适用于评估深度学习目标检测模型在复杂多变场景下的鲁棒性与泛化能力,弥补了真实数据集中难以系统化采集极端或罕见场景的不足。
实际应用
在实际应用中,CrowdSim2所模拟的城市场景直接服务于智能交通与公共安全领域。基于该数据集训练的检测模型可部署于交通流量监测系统,实现车辆计数、拥堵预警与信号灯优化;同时,行人检测技术可应用于地铁站、商场等公共场所的客流分析与异常行为识别。此外,合成数据的可控性允许针对特定需求定制场景,例如隧道内车辆重识别,从而加速安防监控与自动驾驶感知系统的迭代验证,降低实地测试的风险与成本。
衍生相关工作
CrowdSim2的发布催生了一系列衍生研究工作,推动了合成数据在计算机视觉中的深度应用。其核心贡献在于将受控合成环境从训练阶段拓展至测试基准,启发了后续如多目标跟踪、行为识别等任务的合成数据集构建。相关工作包括基于Unity模拟器的动作识别场景生成,以及融合多摄像头视角的城市环境重建,用于评估跨视角目标关联算法。这些工作共同印证了合成数据作为可控测试平台的巨大潜力,为打破真实数据局限、实现模型鲁棒性认证提供了可复现的标准化路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作