Atlas

Name: Atlas
Creator: 爱立信研究
Published: 2019-08-13 00:46:00
License: 暂无描述

arXiv2019-08-13 更新2024-06-21 收录

下载链接：

https://github.com/vumaasha/atlas

下载链接

链接失效反馈

官方服务：

资源简介：

Atlas数据集是由爱立信研究和科罗拉多大学合作创建的，专注于电子商务服装产品分类的高质量数据集。该数据集包含186,150张服装图像，涵盖52个类别路径，支持三级深度分类。数据集的创建过程涉及从多个电子商务平台爬取产品列表，并通过人工和自动方法进行数据清洗和标注。Atlas数据集旨在解决电子商务领域中产品分类不统一和分类标准缺失的问题，支持图像分类和序列模型等技术在产品分类任务中的应用，以提高电子商务平台的用户体验和运营效率。

The Atlas Dataset is a high-quality dataset co-developed by Ericsson Research and the University of Colorado, focusing on e-commerce clothing product classification. It contains 186,150 clothing images covering 52 category paths and supports three-level hierarchical classification. The dataset creation process involved crawling product listings from multiple e-commerce platforms, followed by data cleaning and annotation using both manual and automated methods. The Atlas Dataset aims to address the issues of inconsistent product classification and lack of unified classification standards in the e-commerce domain, and supports the application of technologies such as image classification and sequence models in product classification tasks to enhance the user experience and operational efficiency of e-commerce platforms.

提供机构：

爱立信研究

创建时间：

2019-08-13

搜集汇总

数据集介绍

构建方式

在自动驾驶领域，交通信号灯感知是确保车辆安全通过复杂城市环境的核心任务。ATLAS数据集的构建旨在弥补现有公开数据集在标注覆盖范围和环境多样性方面的不足。该数据集通过配备多视角摄像头的自动驾驶研究车辆CoCar NextGen采集图像，涵盖了前中焦、前长焦和前广角三种不同视场的相机配置，以应对欧洲城市中交通信号灯距离停车线较近或较远时的检测需求。数据采集以20赫兹的频率同步进行，但为提升标注效率，仅以2赫兹的频率选取图像进行标注。标注过程采用半监督迭代方法：首先利用当前最优模型生成初步预测，随后由标注人员手动修正并添加遗漏的边界框，最后经过第二人复核以确保标注质量。特别地，数据集纳入了中到大雨条件下的图像，并针对罕见信号灯状态（如黄灯和红黄灯）进行了增强标注，最终包含33,044张图像和72,998个标注边界框，涵盖了25种独特的图示符号与状态组合。

特点

ATLAS数据集在交通信号灯感知领域展现出显著的特点。其核心优势在于提供了迄今为止最为全面的标注范围，不仅包含了常见的红、绿、黄及红黄过渡状态，还完整标注了多种车道专用方向指示图示符号，例如直行右转箭头，这在现有公开数据集中是缺失的。此外，数据集首次引入了多相机视场配置的标注数据，模拟了真实自动驾驶系统中为应对不同检测距离而采用的多摄像头架构。环境多样性是另一大特色，数据集特意包含了大量中到大雨天气下的图像，有效解决了模型在恶劣天气条件下性能退化的问题。标注质量通过严谨的双重人工校验流程得以保证，同时采用先进的匿名化技术处理了图像中的个人身份与车牌信息，且经测试验证，匿名化处理未对模型训练性能产生负面影响。

使用方法

ATLAS数据集主要用于训练和评估基于视觉的交通信号灯检测与分类模型。研究人员可将该数据集与现有数据集（如DTLD）结合使用，以训练YOLO系列等先进的目标检测架构，从而提升模型在复杂环境下的准确性与泛化能力。数据集中提供的多相机视场图像使得模型能够学习适应不同焦距下的检测任务，特别是针对近距离广角视野和远距离长焦视野中的信号灯。在部署层面，数据集支持构建完整的感知框架：检测模块处理图像并输出边界框与分类；投影与关联模块利用高清地图中的交通灯三维参考位置，通过图匹配算法（如匈牙利算法）将二维检测与三维地图实体关联；决策模块则采用环形缓冲区机制对关联结果进行平滑与跟踪，确保状态输出的稳定性，最终为自动驾驶栈提供可靠的信控状态输入以进行路径规划与决策。

背景与挑战

背景概述

在自动驾驶技术迅猛发展的浪潮中，交通信号灯的精准感知是确保车辆在城市复杂环境中安全导航的核心环节。由FZI信息技术研究中心与卡尔斯鲁厄理工学院的研究团队于2025年提出的ATLAS数据集，正是为了应对现有公开数据集在交通灯状态与象形图标注不全、环境条件单一以及摄像头视野局限等关键缺陷而构建。该数据集通过整合多摄像头配置与多样化天气场景的标注，致力于提升自动驾驶系统在真实世界中的泛化能力与鲁棒性，为交通灯检测模型的训练与评估提供了更为全面可靠的基础。

当前挑战

ATLAS数据集所针对的交通灯感知领域，长期面临复杂交叉路口、遮挡现象及恶劣天气条件下识别稳定性不足的挑战。具体而言，现有数据集普遍缺乏对全部交通灯状态（如红黄过渡状态）与车道专用象形图的完整标注，且多局限于单一视野摄像头，难以适应自动驾驶车辆中多焦距摄像头的实际部署需求。在数据集构建过程中，研究团队需克服远距离微小交通灯的精准标注、雨雾等低能见度环境下的图像采集，以及通过迭代式半自动标注流程确保大规模数据中标注一致性与质量等多重技术难题。

常用场景

经典使用场景

在自动驾驶的视觉感知系统中，交通信号灯的精准识别是确保车辆安全通过城市交叉路口的核心环节。ATLAS数据集通过提供涵盖多种交通灯状态、象形符号及多样化环境条件的标注数据，为训练和评估先进的交通灯检测模型奠定了坚实基础。该数据集最经典的使用场景在于支持基于卷积神经网络的物体检测架构，如YOLO系列模型，在复杂多变的真实驾驶环境中实现高精度、低延迟的交通灯状态分类与定位，从而为自动驾驶决策栈提供可靠的感知输入。

解决学术问题

ATLAS数据集有效解决了现有公开数据集在交通灯感知研究中的若干关键局限。传统数据集往往缺乏全面的象形符号标注，例如直行右转箭头等特定指示，且未能涵盖雨夜等恶劣环境条件，导致训练模型泛化能力不足。此外，单一固定视场的相机设置限制了模型在真实多相机自动驾驶系统中的适用性。ATLAS通过引入多视场相机采集的图像、详尽的象形符号与状态组合标注，以及包含中到大雨场景的数据，显著提升了检测模型在准确性、鲁棒性和环境适应性方面的性能，推动了交通灯感知技术向更可靠、更实用的方向发展。

衍生相关工作

ATLAS数据集的发布促进了交通灯感知领域一系列相关工作的深化与拓展。它直接支撑了其原论文中提出的模块化感知框架的研发，该框架创新性地将检测、投影关联与决策缓冲模块相结合。此外，数据集为YOLOv9、YOLOv10及YOLO11等最新检测架构在该领域的性能评估提供了基准。相关工作也涉及利用图匹配算法（如匈牙利算法）解决检测与地图位置关联中的误差问题，以及设计环形缓冲区决策机制以平滑检测结果、减少状态闪烁。这些衍生工作共同推动了面向复杂城市场景的、稳定且低延迟的交通灯感知系统的技术进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集