five

pepijn223/super_poulain_qwen36moe-11

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/pepijn223/super_poulain_qwen36moe-11
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人学领域。数据集包含50个episodes和32650帧数据,数据以parquet格式存储。数据集包含机器人动作、状态观测(如关节位置)、图像观测(包括前端和腕部摄像头视频)等特征。视频分辨率为480x640,帧率为30fps。数据集总大小约为300MB(数据文件100MB,视频文件200MB)。

This dataset was created by LeRobot and belongs to the robotics category. It contains 50 episodes and 32,650 frames of data, stored in parquet format. The dataset includes features such as robot actions, state observations (e.g., joint positions), and image observations (including videos from front and wrist cameras). The video resolution is 480x640 with a frame rate of 30fps. The total dataset size is approximately 300MB (100MB for data files and 200MB for video files).
提供机构:
pepijn223
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,专门用于机器人学习研究。数据采集自一台名为omx_follower的机器人平台,通过遥控操作或预设程序执行单一任务,共收集了50个完整演示轨迹(episode),总计32650帧数据,涵盖约30帧/秒的连续动作序列。每条轨迹均以Parquet文件格式存储于data目录下,同时将机器人前视与腕部摄像头采集的视频流以AV1编码的MP4格式保存于videos文件夹中,实现了结构与感知信息的精细化对齐。
特点
数据集的核心特点在于其多模态融合设计:既包含6维关节角度(肩部、肘部、腕部等)的连续动作与状态数据,又提供两个视角(前视与腕部)的640×480分辨率视觉输入。所有数据按1000帧为一块(chunk)进行分片存储,便于高效加载与流式处理。此外,数据集标注了帧索引、时间戳、回合编号等结构化元信息,为模仿学习中的时序建模与轨迹分割提供了天然支持。
使用方法
推荐使用LeRobot库中的dataset接口加载该数据集,通过指定配置名称'default'即可自动解析Parquet与视频文件。用户可将数据按训练集(前50个回合)与验证集拆分,并利用提供的action与observation.state字段进行行为克隆等模仿学习任务。视觉特征可通过observation.images.front和observation.images.wrist键直接获取预压缩视频帧,配合chunks_size参数可实现内存友好的分批训练。
背景与挑战
背景概述
该数据集由研究机构利用LeRobot框架构建,发布于HuggingFace平台,旨在为机器人操控任务提供高质量的训练数据。数据集聚焦于基于视觉反馈的机械臂精确操控,核心研究问题涉及从多模态观测数据中学习动作策略,以提升机器人在复杂环境中的自主决策能力。数据采集采用omx_follower机器人平台,通过50个示范片段记录了共计32650帧的操控动作,涵盖肩部、肘部、腕部和夹爪等多关节运动信息。作为机器人学习领域的重要资源,该数据集支持模仿学习与强化学习研究,推动了从示范数据到鲁棒策略的迁移,对非结构化环境下的机器人操控研究具有基石性影响。
当前挑战
领域层面,机器人操控面临从高维视觉输入中提取运动学特征与拓扑结构相关性的挑战,尤其是多关节协同动作与动态环境交互的复杂性。数据集构建过程中,采集示范动作的精确性与一致性难以保证,操作者演示的微小偏差可能引入噪声,影响策略泛化能力。此外,仅包含单个任务的50段演示,数据量有限且特征空间维度较高,如何从稀疏且高斯的动作分布中学习有效的策略表示是核心难题。多模态数据的同步——如视觉图像与关节状态的对齐——以及30Hz采样率下的时间依赖性建模,也增加了数据处理与模型训练的难度。
常用场景
经典使用场景
在机器人学习与自主操控领域,该数据集凭借其精细的传感器记录与多视角视觉信息,成为模仿学习与行为克隆研究的理想基石。数据集包含6维关节空间的动作指令和状态观测,辅以前置与腕部摄像头的高清视频流,为从人类演示中端到端习得操纵策略提供了完备的监督信号。尤为经典的是,其结构严格遵循LeRobot框架,支持将50个轨迹片段以100帧为粒度进行切片,便于构建时序预测模型或离线强化学习的训练管道。
解决学术问题
该数据集直面机器人操控任务中数据稀疏性与泛化能力不足的顽疾。通过标准化记录机械臂的肩、肘、腕及夹爪位姿,它为研究如何从有限演示中抽取鲁棒的运动先验提供了基准。学者可据此探讨多模态观测融合(如视觉与关节状态的结合)对策略迁移性的影响,或验证离线强化学习算法在低数据量场景下的效率。其开源协议与可复现的采集流程,更推动了机器人领域实验标准的统一。
衍生相关工作
该数据集的发布催生了若干里程碑式成果。研究人员基于其提供的标准化轨迹格式,开发出高效的策略蒸馏框架(如将多任务演示压缩为轻量级Transformer模型),以及针对关节空间与视觉空间异质性设计的跨模态对比学习算法。此外,它还被用于验证因果推断在机器人动作序列中的有效性,衍生出用于异常检测的时序对比编码器,为构建鲁棒的操作系统铺平了道路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作