five

task_2_slow

收藏
Hugging Face2026-05-20 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/push-that-thing/task_2_slow
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学数据集,使用LeRobot工具创建,专注于机械臂操作任务的演示数据。它包含136个完整任务片段(episodes),总计114,815帧数据,对应一个具体任务。数据以parquet文件格式存储,总数据量约100MB,同时包含约200MB的MP4格式视频文件,视频帧率为30fps。数据集的主要特征字段包括:动作指令(action),为一个6维浮点数组,分别对应机械臂的肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置;状态观测(observation.state),同样为6维浮点数组,记录机械臂各关节的实时位置;图像观测(observation.images.front),为来自前置摄像头的视频数据,分辨率为480x640,3通道彩色图像。此外,还包含时间戳(timestamp)、帧索引(frame_index)、片段索引(episode_index)、全局索引(index)和任务索引(task_index)等元数据字段。该数据集适用于机器人模仿学习、强化学习、行为克隆等任务的研究与模型训练,并采用Apache-2.0许可证。
创建时间:
2026-05-20
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集隶属于机器人操作领域,聚焦于“推物体”(push-that-thing)这一精细任务,并专门采集了执行速度较慢的演示轨迹。数据集的构建依托于LeRobot开源框架,使用so_follower机器人平台进行数据采集。全部数据包含136个演示片段,共计114815帧图像与状态信息,飞行时间(FPS)设定为30帧/秒。数据存储采用分块式Parquet格式与MP4视频编码,确保了高效读取与大规模扩展的灵活性。数据管理遵循标准的组织方式,每一条轨迹都记录了机器人六个关节的位置信息、前端摄像头采集的480×640分辨率彩色图像以及时间戳、帧索引等元数据,为后续的模仿学习与运动规划研究提供了高质量的结构化演示数据。
使用方法
数据集的加载与使用高度整合了LeRobot生态系统的工具链。用户可通过LeRobot库中的数据集加载器直接读取,其默认配置指向data/*/*.parquet格式的演示数据。在预处理阶段,系统会根据meta/info.json中的元数据信息自适应构建数据管道,支持按训练/测试集(训练集覆盖全部136个片段)进行划分。由于数据结构清晰,每个样本都包含索引、时间戳、帧索引、任务索引以及稠密的状态-动作对,适合序列模型(如Transformer或LSTM)的训练。此外,LeRobot还提供了可视化界面,方便研究者在交互式环境中预览轨迹动画与状态变化,加速模型调试与分析过程。
背景与挑战
背景概述
在机器人学习领域,数据集是驱动模仿学习和策略泛化能力提升的核心资源。task_2_slow数据集由LeRobot框架创建,其研究重点在于采集机器人执行特定操作任务时的慢速轨迹数据,以支持精细动作的建模与分析。该数据集记录了单任务下136个完整演示片段(episodes),共计约11.5万帧(frames),包含6自由度关节动作指令与实时状态观测,并通过前置摄像头捕获高分辨率视频流(480×640像素,30帧/秒)。这些多模态数据为研究机器人运动规划、状态估计以及视觉-动作耦合等关键问题提供了标准化基准。数据集基于Apache-2.0协议公开,依托HuggingFace平台分发,便于社区复现与扩展。其核心研究问题聚焦于探索慢速操作模式下的机器人行为特征,对推动低动态环境中的技能学习与稳定控制具有重要参考价值。
当前挑战
该数据集所解决的领域问题核心在于机器人精细化操作中的数据表征与泛化瓶颈。传统数据集往往侧重高速或常规速度下的运动,而task_2_slow聚焦慢速操作,这要求模型必须处理更细微的关节角度变化和更长期的状态依赖,增加了动作序列建模的复杂度。构建过程中面临的挑战则来自多模态数据的高精度同步:需要协调6通道动作数据、状态观测与30帧/秒视频流的严格时间对齐,并确保在100MB的数据文件和200MB的视频文件中维持一致的时间戳与帧索引。此外,仅依赖单个前视摄像头可能导致部分操作视角受限,影响对遮挡情况的鲁棒性;同时,单一任务类型(task_index为1)限制了跨任务迁移能力的评估,未来需要更丰富的任务场景以验证数据集的泛化效果。
常用场景
经典使用场景
在机器人学习与模仿学习领域,task_2_slow数据集为研究慢速、精细化的操作任务提供了宝贵的数据基础。该数据集记录了so_follower机器人在执行一项特定任务时的136个完整轨迹,包含约11.5万帧的高频(30FPS)观测数据,涵盖6维关节空间的动作指令与状态信息,并同步采集了前视RGB视频。这一丰富的时间序列数据使得研究者能够深入探索基于视觉的机器人策略学习,尤其是在需要精确控制与稳定执行的慢速操作场景中,成为训练行为克隆、逆强化学习等经典算法的理想选择。
解决学术问题
该数据集有效解决了机器人学中关于“慢速精细操作策略学习”的学术研究难题。传统的机器人数据集多聚焦于高速、大范围运动,而task_2_slow则针对性地提供了低速、高精度任务情境下的多模态数据,从而攻克了数据稀疏性与运动灵敏性之间的平衡问题。它使学术界能够深入研究状态空间与动作空间的高度非线性映射关系,为探索小样本学习、轨迹泛化及不确定性下的鲁棒控制提供了可复现的基准,显著推动了从演示中学习的理论框架在实际机器人系统中的应用与验证。
实际应用
在实际应用层面,task_2_slow数据集所代表的慢速操作策略可直接赋能工业装配、医疗手术辅助及精密抓取等对准确性要求严苛的机器人系统。通过利用该数据集训练出的策略模型,机器人能够在缓慢且受控的流程中完成如电子元件插接、微小零件对齐等任务,极大减少了因动态冲击导致的失败率。此外,基于该数据开发的算法还可迁移至服务机器人场景,协助完成倒水、整理易碎物品等需要柔和与稳定操控的家居任务,展现出从学术研究到产业落地的巨大转化潜力。
数据集最近研究
最新研究方向
在机器人行为克隆与模仿学习领域,task_2_slow数据集聚焦于慢速、精细化的操纵任务,例如推动物体。该数据集记录了SO Follower型机械臂在6自由度空间中的关节位置与速度指令,包含136个演示片段和超过11万帧时间序列数据(30fps),并辅以640×480分辨率的彩色视频。当前前沿研究方向集中于利用该数据集训练基于视觉-关节状态联合编码的端到端策略,探索低延迟、高鲁棒性的技能迁移方法。结合LeRobot开源生态,研究者致力于将慢速演示转化为可泛化的操控原语,以推动机器人学习在生活辅助、精准装配等场景中的实际部署,其结构化设计也为基于Transformer或扩散策略的时序建模提供了理想基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作