five

PutRubbishInBin_images

收藏
Hugging Face2025-11-02 更新2025-11-03 收录
下载链接:
https://huggingface.co/datasets/RonPlusSign/PutRubbishInBin_images
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由LeRobot创建的机器人数据集,包含500个episodes,77242个frames,专注于1个任务。数据集的特征包括机械臂末端位置、姿态、夹爪状态、关节位置等,并提供多种视角的图像数据。数据集遵循apache-2.0许可。
创建时间:
2025-11-02
原始信息汇总

PutRubbishInBin_images 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

  • 总任务数: 1
  • 总回合数: 500
  • 总帧数: 77242
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 10 FPS
  • 分块大小: 1000
  • 数据分割: 训练集 (0:500)

数据结构

  • 数据格式: Parquet
  • 数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

观测数据

  • observation.state: 末端执行器状态 (7维浮点数组)

    • 位置: x, y, z
    • 姿态: roll, pitch, yaw
    • 夹爪状态: 0.0闭合, 1.0打开
  • observation.state.joints: 机器人关节位置 (7维浮点数组)

    • 关节: joint_1 到 joint_7
  • observation.images: 多视角RGB图像 (256×256×3)

    • 左肩视角
    • 右肩视角
    • 前视角
    • 腕部视角
    • 顶部视角

动作数据

  • action: 增量动作 (7维浮点数组)
    • 欧拉表示: [xyz+rotation+gripper]

元数据

  • task_description: 任务自然语言描述 (字符串)
  • timestamp: 时间戳 (浮点数)
  • frame_index: 帧索引 (整数)
  • episode_index: 回合索引 (整数)
  • index: 数据索引 (整数)
  • task_index: 任务索引 (整数)

技术规格

  • 机器人类型: Franka
  • 代码库版本: v3.0
  • 图像尺寸: 256×256像素
  • 色彩通道: 3 (RGB)
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务数据采集领域,PutRubbishInBin_images数据集通过Franka机器人平台系统性地构建。该数据集包含500个完整任务片段,总计77242帧数据,以10Hz频率采集多视角视觉信息与机器人状态数据。数据采用分块存储架构,每1000帧构成一个数据块,通过标准化的Parquet格式保存观测状态、关节角度及动作向量等结构化特征,形成完整的机器人操作行为记录。
特点
该数据集显著特点在于融合多模态传感器数据,提供左肩、右肩、前视、腕部及俯视五个角度的256×256分辨率RGB图像流。机器人末端执行器的七维位姿状态与七关节角度数据构成完整的动力学表征,配合增量式动作向量和自然语言任务描述,构建出精细的机器人操作行为图谱。所有数据均附带时间戳与帧索引,确保时序一致性。
使用方法
研究人员可通过LeRobot代码库加载该数据集,利用预定义的数据路径访问分块存储的Parquet文件。数据集专为机器人模仿学习算法设计,支持从多视角图像重建三维操作场景,结合状态-动作对训练控制策略。用户可提取关节轨迹与末端位姿序列进行动力学分析,或利用任务描述文本开展视觉语言导航研究,所有数据均遵循Apache 2.0许可协议。
背景与挑战
背景概述
PutRubbishInBin_images数据集作为机器人操作领域的重要资源,聚焦于环境交互任务的视觉数据采集。该数据集由HuggingFace的LeRobot项目团队构建,采用Franka机器人平台,通过多视角图像序列记录机械臂执行垃圾投递任务的完整过程。其核心研究目标在于解决机器人基于视觉感知的精细操作问题,通过整合末端执行器状态、关节角度与多摄像头视觉流,为模仿学习与强化学习算法提供高维度训练数据。该数据集通过500个任务片段与7.7万帧数据,显著推进了家庭服务机器人对复杂场景的适应性研究。
当前挑战
在机器人操作领域,该数据集需应对动态环境中目标物定位与抓取轨迹规划的复合挑战。具体而言,机械臂需在存在视觉遮挡和光照变化的场景中,实现垃圾物品的稳定抓取与精准投递,这对动作序列的连续性与空间精度提出极高要求。数据构建过程中,多传感器时序同步与海量视频数据的存储优化构成主要技术瓶颈,同时需保持7自由度机械臂运动轨迹与五路摄像头采集帧率的一致性。此外,跨模态数据对齐与实时动作标注的可靠性验证,亦是保障数据集质量的关键难题。
常用场景
经典使用场景
在机器人操作学习领域,PutRubbishInBin_images数据集为模仿学习算法提供了丰富的训练素材。该数据集通过多视角视觉观察与机械臂状态数据的同步记录,构建了完整的机器人操作轨迹。研究人员可利用该数据集训练端到端的机器人控制策略,使机械臂能够准确识别垃圾位置并完成投放动作。数据集包含77242帧高质量图像数据,涵盖肩部、腕部和俯视等多个视角,为视觉-动作映射研究提供了坚实基础。
实际应用
在现实场景中,该数据集支撑的服务机器人垃圾投放功能具有广泛的应用前景。基于此数据集训练的模型可部署于家庭服务机器人,实现自动化的环境清理。工业场景中,类似的抓取放置技术可应用于生产线物料分拣。数据集提供的多视角视觉系统设计思路,为复杂环境下的机器人感知提供了实用参考。其开源的特性降低了机器人技术研发门槛,促进了智能机器人技术的普及与应用。
衍生相关工作
围绕该数据集衍生的研究工作主要集中于机器人视觉运动规划领域。基于LeRobot框架的研究团队开发了多种端到端的机器人控制算法,实现了从视觉感知到动作执行的直接映射。相关研究扩展了数据集的用途,将其应用于更复杂的操作任务中。在模仿学习方面,该数据集催生了基于Transformer的序列预测模型,显著提升了机器人操作任务的完成精度。这些工作共同推动了机器人学习从仿真到实物的技术跨越。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作