five

CLVR Jaco Play Dataset

收藏
github2023-04-25 更新2024-12-12 收录
下载链接:
https://github.com/clvrai/clvr_jaco_play_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
CLVR Jaco Play Dataset 是一个专注于遥控机器人领域的数据集,由南加州大学和 KAIST 的研究团队于 2023 年发布,它提供了 1,085 个遥控机器人 Jaco 2 的片段,并配有相应的语言注释。这个数据集对于研究机器人遥控、自然语言处理以及人机交互等领域的科学家和开发者来说,是一个非常宝贵的资源。

The CLVR Jaco Play Dataset is a dataset focused on the field of remote-controlled robotics, released in 2023 by research teams from the University of Southern California and KAIST. It provides 1,085 segments of the remote-controlled robot Jaco 2, accompanied by corresponding linguistic annotations. This dataset is an invaluable resource for scientists and developers researching remote-controlled robotics, natural language processing, and human-robot interaction.
提供机构:
南加州大学、KAIST
创建时间:
2023-04-25
原始信息汇总

CLVR Jaco Play Dataset 概述

数据集基本信息

  • 名称:CLVR Jaco Play Dataset
  • 数据量:1085个远程操作的机器人片段
  • 包含内容:语言注释
  • 数据收集频率:10Hz

数据下载

  • 下载方式
    • 使用提供的脚本下载:bash download_jaco_data.sh ./data
    • 手动下载链接:https://drive.google.com/file/d/1tVSilmXhyQd8gxZAEhvKMnynw0qzRFSZ/view?usp=share_link
  • 数据大小:约16GB

数据结构

  • 观测数据
    • front_cam_ob:来自第三人称摄像头的观测
    • mount_cam_ob:来自固定摄像头的观测
    • ee_cartesian_pos_ob:末端执行器的笛卡尔位置(前3个元素为位置,后4个元素为四元数格式的方向)
    • ee_cartesian_vel_ob:末端执行器的笛卡尔速度(前3个元素为位置变化,后3个元素为滚转、俯仰、偏航格式的方向变化)
    • joint_pos_ob:Jaco臂的关节位置(仅使用最后2个元素对应于夹持器关节)
  • 动作数据
    • 前3个元素为笛卡尔增量
    • 第4个元素为标签:0(打开夹持器)、1(不移动夹持器)、2(关闭夹持器)
  • 终止标志:每个技能结束时为1
  • 提示:目标的自然语言描述
  • 奖励:每个技能结束时为1

引用信息

bibtex @software{dass2023jacoplay, author = {Dass, Shivin and Yapeter, Jullian and Zhang, Jesse and Zhang, Jiahui and Pertsch, Karl and Nikolaidis, Stefanos and Lim, Joseph J.}, title = {CLVR Jaco Play Dataset}, url = {https://github.com/clvrai/clvr_jaco_play_dataset}, version = {1.0.0}, year = {2023} }

许可证

  • 许可证类型:Creative Commons Attribution 4.0 International License
  • 许可证链接:https://creativecommons.org/licenses/by/4.0/
搜集汇总
数据集介绍
main_image_url
构建方式
CLVR Jaco Play数据集的构建基于1085个远程操控的机器人操作片段,这些片段通过10Hz的频率进行采集。数据采集过程中,机器人配备了多个传感器,包括第三人称视角摄像头、固定摄像头以及末端执行器的位置和速度传感器。每个操作片段均附有自然语言描述的目标提示,确保了数据的多样性和丰富性。数据集的构建旨在为机器人学习和控制任务提供高质量的多模态数据支持。
特点
该数据集的特点在于其多模态数据的整合与标注。每个操作片段包含五个主要观测属性:第三人称视角摄像头观测、固定摄像头观测、末端执行器的笛卡尔位置和速度、以及机械臂的关节位置。此外,数据集还提供了动作序列、终止标志、自然语言目标提示和奖励信号。这些多维度的数据为机器人学习任务提供了全面的信息,尤其是在模仿学习和强化学习领域具有重要价值。
使用方法
使用CLVR Jaco Play数据集时,用户可以通过提供的Colab示例快速了解数据的加载和使用方法。数据集以压缩文件形式提供,用户可通过`gdown`工具或手动下载获取。数据解压后,用户可根据需求提取观测属性、动作序列、目标提示等信息。数据集的结构清晰,便于直接应用于机器人控制算法的训练与测试。此外,数据集的自然语言标注为语言引导的机器人任务提供了重要支持。
背景与挑战
背景概述
CLVR Jaco Play数据集由南加州大学和KAIST的研究团队于2023年发布,旨在推动机器人操作与自然语言理解相结合的领域研究。该数据集包含1085个通过远程操作生成的机器人任务片段,并附有语言注释。其主要研究问题聚焦于如何通过自然语言指令指导机器人执行复杂任务,特别是在多模态感知与动作规划的结合上。该数据集的发布为机器人学习、任务规划以及人机交互领域提供了重要的实验基础,推动了相关技术的进一步发展。
当前挑战
CLVR Jaco Play数据集在解决机器人任务规划与自然语言指令理解方面面临多重挑战。首先,如何从多模态感知数据(如视觉、关节位置和末端执行器状态)中提取有效特征以支持任务执行,是一个关键问题。其次,数据集中语言注释与机器人动作之间的对齐需要高度精确,这对模型的泛化能力提出了更高要求。此外,数据采集过程中,远程操作的高频数据记录(10Hz)对存储与计算资源提出了挑战,同时确保数据的一致性与完整性也是构建过程中的一大难点。
常用场景
经典使用场景
CLVR Jaco Play Dataset 是一个包含1085个远程操作机器人任务的数据集,特别适用于机器人学习与自然语言处理(NLP)的交叉研究。该数据集通过多视角摄像头、末端执行器位置、速度以及关节位置等多模态数据,为机器人任务的学习提供了丰富的输入信息。其经典使用场景包括机器人任务规划、强化学习模型的训练与评估,尤其是在结合自然语言指令进行任务执行的研究中,该数据集为模型提供了真实世界的复杂任务环境。
实际应用
在实际应用中,CLVR Jaco Play Dataset 可用于开发智能家居机器人、工业自动化机器人以及服务机器人等。通过结合自然语言指令,机器人可以更直观地理解用户需求并执行复杂任务。例如,在家庭环境中,机器人可以根据语音指令完成物品抓取、摆放等操作;在工业场景中,机器人可以通过学习该数据集中的任务规划数据,实现更高效的自动化操作。这些应用场景展示了该数据集在推动机器人技术实用化方面的潜力。
衍生相关工作
基于 CLVR Jaco Play Dataset,许多经典研究工作得以展开。例如,研究人员利用该数据集开发了结合自然语言处理与强化学习的机器人任务规划模型,显著提升了机器人在复杂环境中的任务执行能力。此外,该数据集还被用于多模态数据融合算法的研究,推动了机器人感知与决策系统的进一步发展。这些衍生工作不仅验证了数据集的价值,也为机器人学习领域提供了新的研究方向和技术突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作