five

SydneyScapes

收藏
arXiv2025-04-10 更新2025-04-12 收录
下载链接:
https://hdl.handle.net/2123/33051
下载链接
链接失效反馈
官方服务:
资源简介:
SydneyScapes是一个为计算机视觉任务设计的图像语义、实例和全场景分割数据集。该数据集由在澳大利亚新南威尔士州悉尼及其周边城市收集的756张高质量像素级注释图像组成,旨在为自动驾驶汽车行业和研究人员提供算法开发、测试和部署在澳大利亚环境下的注释数据和工具。数据集涵盖了不同的环境条件,如不同的光照和人群密度,适用于领域自适应和模型鲁棒性研究在澳大利亚城市环境中。

SydneyScapes is an image semantic, instance and panoptic segmentation dataset designed for computer vision tasks. This dataset comprises 756 high-quality pixel-level annotated images collected from Sydney, New South Wales, Australia and its surrounding cities, aiming to provide annotated data and supporting tools for algorithm development, testing and deployment tailored to Australian environments, serving both the autonomous driving industry and researchers. The dataset covers a wide range of environmental conditions such as varying lighting intensities and crowd densities, and is suitable for domain adaptation and model robustness research in Australian urban contexts.
提供机构:
悉尼大学,澳大利亚机器人中心
创建时间:
2025-04-10
搜集汇总
数据集介绍
main_image_url
构建方式
SydneyScapes数据集的构建过程体现了严谨的科学方法与工程实践的结合。研究团队采用配备高性能车载摄像机的城市车辆,在悉尼及新南威尔士州周边地区进行自然驾驶状态下的数据采集。通过精心设计的传感器配置方案——包括120°水平视场角的GMSL相机和2.3百万像素的CMOS传感器,确保了图像采集的全面性和高分辨率。数据经过严格的筛选流程,最终选取756张具有代表性的图像,并按照光照条件和场景特征划分为白天、夜间和人群密集三个子集。在标注环节,团队借鉴Cityscapes的标准并针对澳大利亚特色进行调整,采用七大类别的分层标注体系,同时运用DeepPrivacy算法和YOLOv8模型实现人脸和车牌信息的隐私保护处理。
特点
该数据集最显著的特点是针对澳大利亚城市环境的专属适配性。其图像内容涵盖了悉尼特有的道路标识、本土植被和建筑风格,弥补了现有数据集中南半球城市特征的缺失。数据集提供像素级的三重标注体系——语义分割、实例分割和全景分割,且特别关注极端光照条件下的数据平衡,包含104张夜间场景图像。统计显示,标注数据中'道路'、'建筑'等静态元素占比达42.3%,而'汽车'类实例数量最为丰富,充分反映了澳大利亚城市交通的特点。这种针对地域特性的设计使数据集成为研究域适应性的理想测试平台。
使用方法
研究者可通过数据集官网获取完整的图像数据及标注文件,配套提供的Colab可视化工具支持在线交互式探索。基准测试表明,使用Cityscapes预训练模型在本地数据上微调能显著提升性能,如Mask2Former模型mIoU指标提高22.67%。建议采用80%-20%的标准划分进行训练验证,针对不同子集特性可调整训练策略——日间子集适合研究农村道路特征,人群子集则聚焦密集场景分析。数据集特别适合以下研究方向:跨域适应算法验证、低光照条件下分割性能优化,以及针对澳大利亚特有交通元素的识别模型开发。
背景与挑战
背景概述
SydneyScapes数据集由悉尼大学澳大利亚机器人中心的研究团队于2025年发布,旨在填补澳大利亚城市环境在计算机视觉领域的空白。该数据集聚焦于自动驾驶车辆感知系统中的图像分割任务,包含756张高质量像素级标注的图像,覆盖悉尼及新南威尔士州周边城市的多样化场景。作为首个针对澳大利亚独特道路特征(如本土植被、特殊交通标志和建筑风格)的标注数据集,SydneyScapes为语义分割、实例分割和全景分割任务提供了重要基准,有效解决了跨国模型部署时的领域适应问题。其创新性在于包含了昼夜不同光照条件和人群密集场景的子集,为算法在复杂环境中的鲁棒性测试提供了关键数据支持。
当前挑战
SydneyScapes数据集面临的核心挑战体现在两个方面:领域适应性方面,澳大利亚特有的右舵驾驶规则、独特的道路基础设施与植被分布,导致基于欧美数据训练的模型出现显著性能下降,特别是在'轨道车辆'等本地特色类别的识别准确率不足7%;数据构建方面,研究团队需解决极端光照条件下(如正午强光与夜间低照度)的标注一致性难题,同时应对隐私保护要求,开发了基于DeepPrivacy算法的面部替换和YOLOv8车牌模糊化技术。此外,数据分布不均衡问题突出,'行人'和'汽车'类别标注量占总量68%,而'摩托车'等稀有类别样本不足0.1%,这对模型的泛化能力提出了严峻考验。
常用场景
经典使用场景
SydneyScapes数据集专为澳大利亚城市环境设计,广泛应用于自动驾驶车辆的感知系统开发。其高精度的像素级标注支持语义分割、实例分割和全景分割任务,为算法在复杂城市景观中的性能评估提供了基准。数据集涵盖了悉尼及周边地区的多样化场景,包括不同光照条件和人群密度,为模型在真实世界中的泛化能力测试提供了丰富素材。
解决学术问题
该数据集有效解决了机器学习模型在跨地域部署时的域适应问题。通过提供具有澳大利亚本土特色的标注数据,研究人员能够针对性地优化模型以适应当地独特的道路标志、植被和建筑风格。数据集填补了南半球城市环境数据的空白,为研究域偏移、模型鲁棒性及小样本学习等关键学术问题提供了实验平台。
衍生相关工作
基于SydneyScapes的基准测试催生了多项创新研究,包括针对域适应的新型Transformer架构和轻量级分割网络设计。部分工作聚焦于融合多模态数据以提升低光照条件下的分割精度,另有研究利用该数据集开发了专门处理澳大利亚特有植被分类的算法。这些衍生成果显著推动了计算机视觉在地域化应用中的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作