Cityscapes
收藏arXiv2025-09-30 收录
下载链接:
https://www.cityscapes-dataset.com/dataset-overview/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专为语义城市场景理解而设计,尤其适用于对象检测任务。此外,该数据集还针对加入了强降雨效果的版本进行了评估。
This dataset is specifically designed for semantic urban scene understanding, and is particularly suited for object detection tasks. Furthermore, evaluations have been conducted on its variant augmented with heavy rainfall effects.
搜集汇总
数据集介绍

构建方式
Cityscapes数据集基于对50个不同城市复杂城市场景的广泛采集而构建,使用了车载立体相机系统在春秋季进行拍摄,通过精细的后期处理生成高动态范围图像。其核心包含5000张高质量像素级精细标注图像和20000张粗标注图像,精细标注采用分层多边形方法,平均每张图像耗时超过1.5小时以确保边界准确性,粗标注则在7分钟内完成以平衡效率与覆盖度。数据集按城市级别分割为训练集、验证集和测试集,确保地理分布和季节因素的均衡代表性。
特点
该数据集在规模、标注丰富度和场景多样性上显著超越先前工作,涵盖30个视觉类别(如道路、建筑、车辆、行人),并支持像素级和实例级语义标注。其独特之处在于包含来自多城市的密集交通场景,每张图像平均有7个人和11.8个车辆实例,远高于KITTI等数据集。此外,数据集提供立体深度信息和车辆里程计数据,并设计了实例归一化的iIoU评估指标,以公平衡量小目标的分割性能。
使用方法
Cityscapes主要用于训练和评估城市场景语义分割及实例分割模型,研究人员可下载精细标注图像用于监督学习,粗标注图像则适用于弱监督或半监督方法。数据集提供了标准化的训练/验证/测试划分,测试集标注不公开以支持公平基准评测。用户可利用官方提供的FCN基线代码或第三方方法(如DeepLab、Adelaide)进行实验,并通过在线平台提交结果进行性能排名。
背景与挑战
背景概述
Cityscapes数据集由戴姆勒集团、达姆施塔特工业大学、马克斯·普朗克信息学研究所及德累斯顿工业大学于2016年联合推出,旨在推动城市街景语义理解的研究。该数据集聚焦于自动驾驶场景下的像素级与实例级语义分割,覆盖了德国及邻国50座城市的复杂内城交通场景,包含5000张精细标注图像与20000张粗标注图像,其规模与多样性远超同期数据集(如KITTI、CamVid)。Cityscapes的发布为深度学习模型在复杂城市环境中的泛化能力提供了基准,显著促进了语义分割、实例分割及弱监督学习领域的发展,成为自动驾驶视觉感知研究中的里程碑式资源。
当前挑战
Cityscapes所解决的领域问题核心在于城市街景的语义理解,其挑战包括:1)场景复杂性与尺度多样性——密集内城交通中行人、车辆等目标尺度差异显著,且存在大量遮挡与背景混杂,要求模型具备多尺度感知能力;2)细粒度标注的稀缺性——精细标注成本高昂(单图耗时超1.5小时),粗标注虽增加数据量却牺牲边界精度,需探索弱监督或半监督方法以平衡效率与性能。构建过程中,挑战集中于:1)数据采集的均衡性——需在50个城市、不同季节与天气条件下获取代表性场景,避免地理与气候偏差;2)标注质量的控制——通过分层多边形标注与双重校验实现像素级一致性(标注者间一致率达98%),但粗标注中67.5%的密度限制了对小目标的刻画,进一步加剧了实例级分割的难度。
常用场景
经典使用场景
在计算机视觉领域,城市场景语义分割是自动驾驶与环境感知的核心任务。Cityscapes数据集以其高分辨率、多样化的城市街景图像及精细的像素级标注,成为训练和评估语义分割模型的标杆。研究者常利用其5000张精细标注图像和20000张粗略标注图像,构建全卷积网络、DeepLab系列等深度学习架构,以提升对道路、车辆、行人等19类目标的逐像素识别能力。该数据集不仅覆盖50个城市的复杂交通场景,还提供立体视觉深度信息,为多模态感知研究奠定了坚实基础。
实际应用
在实际应用中,Cityscapes数据集直接服务于自动驾驶系统的视觉感知模块,助力车辆精准识别道路边界、交通标志、行人及车辆等关键元素,为路径规划与决策提供可靠依据。此外,该数据集还赋能智能交通监控、城市基础设施维护及增强现实导航等领域,通过训练高精度语义分割模型,实现实时场景解析与异常事件预警。其跨数据集泛化能力也验证了在真实驾驶场景中的迁移潜力,为工业级部署提供了宝贵的数据支撑与验证基准。
衍生相关工作
Cityscapes数据集衍生了一系列经典工作,如DilatedNet通过空洞卷积聚合多尺度上下文信息,在保持分辨率的同时提升分割精度;PSPNet利用金字塔池化模块捕获全局场景线索;而DeepLab系列则结合空洞空间金字塔池化与条件随机场优化边界细节。此外,基于该数据集的实例分割研究催生了Mask R-CNN等模型,将检测与分割统一。弱监督学习方面,研究者利用粗略标注设计半监督训练策略,有效降低了标注成本,这些工作共同推动了城市场景理解技术的持续演进。
以上内容由遇见数据集搜集并总结生成



