five

OoDIS|自动驾驶数据集|异常检测数据集

收藏
arXiv2024-06-18 更新2024-06-19 收录
自动驾驶
异常检测
下载链接:
https://vision.rwth-aachen.de/oodis
下载链接
链接失效反馈
资源简介:
OoDIS是由亚琛工业大学、伍珀塔尔大学和北京理工大学合作开发的数据集,专注于异常实例分割,旨在提高自动驾驶车辆对环境中未知物体的识别能力。该数据集整合了多个现有的异常分割数据集,如Fishyscapes、RoadAnomaly21和RoadObstacle21,提供了多样化的真实世界道路异常案例。创建过程中,研究团队对这些数据集进行了扩展和重新标注,以支持实例分割任务。OoDIS的应用领域主要集中在自动驾驶技术,特别是解决在训练中未见过的异常物体的精确分割问题,这对于避免交通事故至关重要。
提供机构:
亚琛工业大学(德国),伍珀塔尔大学(德国),北京理工大学(中国)
创建时间:
2024-06-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
OoDIS数据集的构建基于对现有异常分割数据集的扩展,特别是Fishyscapes、RoadAnomaly21和RoadObstacle21数据集。这些数据集原本用于语义异常分割,但缺乏实例级别的标注。为了填补这一空白,研究团队对这些数据集进行了重新标注,添加了实例分割的标签。标注过程中,每个异常对象都被单独标记,确保每个实例具有唯一的标识符。此外,为了适应自动驾驶场景的需求,标注策略特别关注了道路上的异常物体,如动物或丢失的货物,并采用了Cityscapes数据集中的平均精度(AP)指标进行评估。
特点
OoDIS数据集的主要特点在于其专注于异常实例分割任务,这在自动驾驶领域尤为重要。数据集包含了多样化的真实世界异常场景,涵盖了不同大小、形状和数量的异常物体。与传统的语义异常分割数据集不同,OoDIS提供了实例级别的标注,使得模型能够区分场景中的多个异常对象。此外,数据集还引入了AP50指标,用于评估模型在50%交并比(IoU)阈值下的表现,特别适用于小尺寸异常物体的检测。这种设计使得OoDIS成为评估和推动异常实例分割方法发展的理想基准。
使用方法
OoDIS数据集的使用方法主要包括模型训练、验证和测试。研究人员可以使用Cityscapes数据集中的19个类别作为内部分布数据进行训练,并允许使用辅助数据(如COCO)来引入虚拟异常。在验证和测试阶段,模型需要在未见过异常物体的情况下进行实例分割。评估时,仅关注异常类别的预测结果,忽略内部分布和模糊区域的预测。通过计算平均精度(AP)和AP50指标,研究人员可以量化模型在异常实例分割任务上的表现。此外,数据集还提供了公开的提交门户,允许研究人员提交新的方法并参与基准测试。
背景与挑战
背景概述
OoDIS(Out-of-Distribution Instance Segmentation)数据集由德国亚琛工业大学、伍珀塔尔大学等机构的研究团队于2024年提出,旨在解决自动驾驶场景中的异常实例分割问题。该数据集扩展了现有的异常分割基准,如Fishyscapes、RoadAnomaly21和RoadObstacle21,增加了实例级别的标注,以支持对未知对象的精确分割。OoDIS的提出填补了异常实例分割领域缺乏专用基准的空白,推动了自动驾驶系统在复杂环境下的感知能力提升。该数据集的核心研究问题是如何在训练数据中未见的对象(如野生动物或道路上的障碍物)出现时,实现精确的实例分割,从而避免潜在的交通事故。OoDIS的发布为相关领域的研究提供了重要的评估工具,促进了异常实例分割方法的发展。
当前挑战
OoDIS数据集面临的挑战主要体现在两个方面。首先,异常实例分割任务本身具有极高的复杂性,尤其是在自动驾驶场景中,模型需要在不依赖特定异常类别训练的情况下,准确分割出未知对象。这种开放集分割问题要求模型具备强大的泛化能力,而现有方法在处理远距离或小尺寸异常对象时表现较差。其次,数据集的构建过程中也面临诸多挑战,例如如何确保实例标注的精确性,尤其是在复杂场景中多个异常对象重叠或遮挡的情况下。此外,OoDIS数据集需要平衡不同场景的多样性,以确保评估结果的广泛适用性。这些挑战不仅推动了异常实例分割算法的创新,也为未来研究提供了明确的方向。
常用场景
经典使用场景
OoDIS数据集主要用于自动驾驶领域中的异常实例分割任务。该数据集通过扩展现有的异常分割基准,提供了对未知对象的实例级分割标注,特别适用于在训练过程中未见的对象(如野生动物或道路上的障碍物)的识别与分割。这一任务对于自动驾驶系统的安全导航至关重要,能够帮助车辆在复杂环境中识别并避免潜在的碰撞风险。
解决学术问题
OoDIS数据集解决了自动驾驶领域中异常实例分割的学术难题。传统的语义分割方法在处理未见过的对象时表现不佳,容易将未知对象错误分类为已知类别。OoDIS通过提供实例级的分割标注,使得模型能够更精确地识别和分割单个异常对象,从而提升了对复杂场景的理解能力。这一数据集填补了异常实例分割领域的空白,推动了相关算法的研究与改进。
衍生相关工作
OoDIS数据集的发布推动了异常实例分割领域的多项经典工作。例如,UGainS、Mask2Anomaly和U3HS等方法均基于该数据集进行了算法优化与性能评估。这些方法通过结合不确定性引导、类无关实例分割等技术,显著提升了异常实例分割的精度与鲁棒性。此外,OoDIS还为后续研究提供了统一的评估基准,促进了该领域的进一步发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。

arXiv 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录