five

RH20T-P|机器人学习数据集|人工智能数据集

收藏
arXiv2024-03-29 更新2024-06-21 收录
机器人学习
人工智能
下载链接:
https://sites.google.com/view/rh20t-primitive/main
下载链接
链接失效反馈
资源简介:
RH20T-P是由上海人工智能实验室创建的一个原始级别的机器人数据集,包含约33000个视频片段,覆盖44种多样且复杂的机器人任务。每个视频片段都根据精心设计的原始技能进行手动标注,旨在促进可组合泛化代理的未来发展。数据集通过分解任务为原始技能,使机器人能够以组合方式泛化到新任务,解决传统算法在处理复杂任务时的局限性。RH20T-P数据集的应用领域包括机器人学习和高级决策制定,特别是在需要复杂视觉推理和长视野规划的任务中。
提供机构:
上海人工智能实验室
创建时间:
2024-03-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
RH20T-P数据集的构建基于RH20T数据集,这是一个包含多种真实世界机器人操作技能的数据库。RH20T-P数据集包含了大约33000个视频剪辑,涵盖了44种多样和复杂的机器人任务。每个剪辑都根据一套精心设计的原始技能进行了人工标注,以便未来开发可组合的泛化代理。RH20T-P数据集的构建过程包括对RH20T中适合可组合泛化代理的任务进行采样,并定义了一套可组合和可扩展的原始技能。
特点
RH20T-P数据集的特点包括多样性、复杂性和原始技能的精细标注。该数据集涵盖了多种类型的任务,包括特殊轨迹、使用工具、复杂的视觉推理和长期规划等。每个视频剪辑都被标注为一系列原始技能,这些技能是从机器人臂的运动和夹持器的状态变化角度进行定义的。原始技能分为基于运动的技能和基于夹持器的技能,每个技能都包含特定的空间信息,以便于进行运动规划。此外,RH20T-P数据集还提供了丰富的空间信息,有助于机器人代理在执行任务时进行精确的空间感知。
使用方法
RH20T-P数据集的使用方法包括将其用于训练可组合泛化代理(CGAs)。为了验证RH20T-P数据集的有效性,研究人员构建了一个名为RA-P的潜在且可扩展的机器人代理。RA-P配备了两个专门的规划器,分别用于任务分解和运动规划。通过可组合泛化,RA-P能够适应新颖的物理技能。在使用RH20T-P数据集进行训练时,研究人员使用了LLaVA作为任务规划器,并使用Deformable DETR作为运动规划器。RA-P在执行任务时,会根据当前状态和观察结果,使用LLaVA进行决策,然后使用Deformable DETR预测运动轨迹,最后由低级控制器执行动作序列。
背景与挑战
背景概述
机器人学习领域的研究目标是开发一个能够执行训练分布内和全新环境中未见技能的全面且可通用的机器人系统。随着大型语言模型(LLMs)在理解和解释指令方面的进步,通过将任务分解为低级计划,可以降低任务的复杂性,从而有可能以可组合的方式对新型机器人任务进行泛化。然而,由于缺乏低级真实世界的机器人数据集,社区尚未充分准备好可组合的泛化代理。本文提出了一种名为RH20T-P的低级机器人数据集,包含约33000个视频片段,涵盖44个多样且复杂的机器人任务。每个片段都根据精心设计的低级技能集进行了人工标注,以促进可组合泛化代理的未来发展。为了验证RH20T-P的有效性,我们还构建了一个基于RH20T-P的潜在且可扩展的代理,称为RA-P。RA-P配备了两个专门从事任务分解和运动规划的规划器,可以通过可组合泛化来适应新型物理技能。本文还讨论了RH20T-P数据集的构建背景、主要研究人员、核心研究问题和影响力等。
当前挑战
尽管RH20T-P数据集在促进可组合泛化代理的发展方面具有巨大潜力,但仍面临一些挑战。首先,现有的可组合泛化代理(CGAs)倾向于使用更大的私有模型,如GPT-4V,通过上下文学习将任务规范分解为低级技能。这种对私有VLMs的依赖导致缺乏透明度和灵活性。其次,机器人任务在空间感知方面的广泛需求,特别是定位特定背景位置的能力,无法与传统定位任务中的前景感知先验相匹配。例如,在从容器中检索物体的任务中,定位容器外的背景位置至关重要。为了积累机器人臂每个动作的背景位置的空间知识,需要基于低级技能对任务进行分段的数据集。没有这样的数据集,CGAs无法为每个动作提供精确的空间信息,并且被迫将空间感知委托给低级控制器,这可能最终增加这些控制器的难度,偏离了CGAs的初衷。
常用场景
经典使用场景
RH20T-P数据集包含约33000个视频片段,涵盖了44种多样且复杂的机器人任务。每个片段都根据一套精心设计的原始技能进行了人工标注,从而为可组合泛化智能体的未来发展奠定了基础。RH20T-P数据集主要用于机器学习和机器人领域,特别是可组合泛化智能体(CGA)的研究。CGA的目标是在新的环境中执行未见的技能,并将已见的技能进行分解,从而提高机器人的泛化能力。RH20T-P数据集通过提供细粒度的原始技能和空间信息,使得CGA能够在新的环境中执行复杂的机器人任务,从而提高机器人的智能水平。
实际应用
RH20T-P数据集的实际应用场景包括机器人制造、智能家居、医疗保健等领域。例如,在机器人制造中,RH20T-P数据集可以帮助机器人执行复杂的装配任务;在智能家居中,RH20T-P数据集可以帮助机器人执行清洁、烹饪等任务;在医疗保健中,RH20T-P数据集可以帮助机器人执行手术、护理等任务。RH20T-P数据集的应用将极大地提高机器人的智能化水平,从而为人类带来更多便利。
衍生相关工作
RH20T-P数据集衍生了许多相关的研究工作。例如,基于RH20T-P数据集,研究人员开发了可组合泛化智能体(CGA)RA-P,该智能体能够通过可组合泛化,将未见的物理技能分解成原始技能,并进行精确的空间定位。此外,研究人员还基于RH20T-P数据集,开发了用于机器人任务分解和运动规划的工具和方法。这些相关的研究工作将进一步推动机器人学习和可组合泛化智能体的发展,并为机器人领域的应用提供新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

Movies Dataset

这个数据集包含电影的详细信息,包括电影名称、评分、类型、年份、发布日期、IMDb评分、投票数、导演、编剧、主演、制作国家、预算、总收入、制作公司和电影时长。

github 收录