five

BOSS (Benchmark for Observation Space Shift)|机器学习数据集|计算机视觉数据集

收藏
arXiv2025-02-22 更新2025-02-25 收录
机器学习
计算机视觉
下载链接:
https://boss-benchmark.github.io/
下载链接
链接失效反馈
资源简介:
BOSS数据集是一个针对观察空间偏移问题的综合评估基准,由美国北卡罗来纳大学教堂山分校的研究团队创建。该数据集在Libero仿真平台上构建,包含三个挑战:单次谓词偏移、累积谓词偏移和真实长距离任务。这些挑战旨在验证观察空间偏移问题,并评估其对长距离任务的影响。数据集通过规则自动修改生成器(RAMG)扩展了现有Libero数据集的视觉多样性,为研究社区提供了有价值的研究资源。
提供机构:
美国北卡罗来纳大学教堂山分校
创建时间:
2025-02-22
AI搜集汇总
数据集介绍
main_image_url
构建方式
BOSS数据集的构建基于LIBERO模拟平台,该平台支持多样化和定制化任务,使用PDDL文件定义任务规划问题。数据集包括未受观察空间变化影响的44个单技能任务和通过规则自动修改生成器(RAMG)生成的1,727个修改后任务。RAMG能够通过改变对象位置、引入新对象或改变对象状态来生成视觉上多样化的任务,以模拟观察空间变化的情况。
特点
BOSS数据集具有以下特点:首先,它专门针对长期任务中的观察空间变化问题(OSS),通过三个挑战来评估不同方面的OSS负面影响。其次,数据集涵盖了从单个观察修改到累积修改再到技能链的真实长期任务,提供了广泛和深入的评估。最后,BOSS数据集展示了数据增强不足以解决OSS问题,强调了未来研究需要算法解决方案。
使用方法
BOSS数据集的使用方法包括:首先,在LIBERO平台上运行已选任务和通过RAMG生成的修改后任务。其次,使用四个流行的模仿学习算法(包括三种行为克隆方法和OpenVLA)在这些任务上进行评估,以比较技能性能在有和没有OSS的情况下的变化。最后,通过计算“性能比率变化”(RPD)和“上限比率变化”(DUBR)等指标来量化OSS对任务性能的影响。
背景与挑战
背景概述
在机器人学习的领域中,长期目标任务的视觉伺服控制一直是研究的热点。BOSS(Benchmark for Observation Space Shift)数据集由杨越等人在2025年提出,旨在评估长期目标任务中观察空间变化(Observation Space Shift, OSS)对机器人性能的影响。该数据集基于LIBERO仿真平台,包含三个挑战:单一谓词变化、累积谓词变化和技能链,分别评估不同情况下OSS对长期目标任务的影响。BOSS数据集的创建为机器人学习领域提供了重要的评估工具,有助于推动相关算法和模型的研究与发展。
当前挑战
BOSS数据集的主要挑战在于观察空间变化(OSS)对长期目标任务的影响。OSS指的是在执行长期目标任务的技能链过程中,前一个技能的执行会导致观察空间的变化,从而影响后续技能的性能。BOSS数据集的三个挑战分别评估了单一谓词变化、累积谓词变化和技能链情况下OSS的影响。此外,BOSS数据集还探讨了数据增强对OSS的缓解作用,结果表明数据增强并不能完全解决OSS问题。因此,BOSS数据集的挑战在于寻找有效的算法和模型来应对OSS问题,提高长期目标任务的性能。
常用场景
经典使用场景
BOSS数据集主要应用于评估机器人学习算法在处理长时序任务时对观察空间变化的适应性。特别是在视觉伺服机器人领域,该数据集用于测试和比较不同模仿学习算法在执行复杂长时序任务时的表现,如技能链。在BOSS数据集中,机器人需要根据任务规划器安排的技能组合顺序执行预训练的视觉运动技能。然而,由于观察空间变化(OSS)问题,即先前技能的顺序执行会导致观察空间的变化,从而影响后续单独训练的技能策略的性能,这些算法在简单的长时序任务中往往表现不佳。因此,BOSS数据集提供了一个平台,用于评估和比较不同算法在处理长时序任务时的鲁棒性和性能。
衍生相关工作
BOSS数据集的发布对机器人学习领域产生了深远的影响。它不仅揭示了OSS问题的重要性,还为研究和开发新的模仿学习算法提供了重要的数据和工具。基于BOSS数据集的研究工作已经取得了一些显著的成果,如提出了新的算法来解决OSS问题,以及开发了新的工具来评估和比较不同算法的性能。此外,BOSS数据集还促进了机器人学习和机器人操作系统领域之间的交流和合作,为推动这两个领域的发展做出了贡献。
数据集最近研究
最新研究方向
在机器人学习领域,长时任务一直是研究的热点,尤其是在视觉伺服机器人完成未见过任务的场景。然而,由于观察空间转换(OSS)的问题,即使是在简单的长时任务中,层次化方法也常常无法达到预期的效果。为了解决这一问题,Yue Yang等人提出了BOSS数据集,旨在评估OSS对长时任务的影响。BOSS数据集包含三个不同的挑战:单一谓词转换、累积谓词转换和技能链,每个挑战都旨在评估OSS的负面影响的不同方面。通过对BOSS数据集的评估,研究人员发现,即使是简单的挑战,技能性能也会平均下降67%,35%,34%和54%。此外,他们还探究了一种可能的解决方案,即通过使用更大、更视觉多样化的演示集来扩展每个技能的训练数据,但结果表明这种方法不足以解决OSS问题。BOSS数据集的提出和评估为长时任务中的OSS问题提供了新的研究思路和方法,有助于推动机器人学习领域的发展。
相关研究论文
  • 1
    BOSS: Benchmark for Observation Space Shift in Long-Horizon Task美国北卡罗来纳大学教堂山分校 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

yolo-datasets

深度学习目标检测数据集/分割数据集最全最完整的数据集集合,包含电力电气领域、航空影像输电线路与输电塔分割、电力遥感风力发电机、安全带和安全绳检测、变压器漏油故障诊断、高压输电线故障检测、光伏热红外缺陷、风电光伏功率数据、变电站火灾、输电线路语义分割、配网缺陷检测、变电站设备目标检测、太阳能光伏电池板缺陷、pcb电路板检测、绝缘体检测、输电线路防震锤缺陷、电线冰雪覆盖、电力工程电网施工现场安全作业、螺丝识别检测、变电站电力设备的可见光和红外图像、无人机航拍输电线路悬垂线夹、电线线路表面损害、氧化锌避雷器破损识别、热斑光伏发电系统红外热图像等多个领域的数据集。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

ISIC 2018

ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。

challenge2018.isic-archive.com 收录