five

Lakesenberg/Seeed_Hackathon_egg_1

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Lakesenberg/Seeed_Hackathon_egg_1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过LeRobot创建的,主要用于机器人技术领域。数据集包含20个episodes,总计14980帧数据,视频数据的帧率为30fps。数据以parquet格式存储,包含机器人的动作和状态观测数据,具体包括7个关节位置(shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_yaw.pos, wrist_roll.pos, gripper.pos)。此外,数据集还包含侧视(880x640分辨率)和手部视角(480x640分辨率)的视频数据,视频编码格式为av1,像素格式为yuv420p,无音频。

This dataset was created using LeRobot and is primarily used in the field of robotics. The dataset contains 20 episodes, totaling 14,980 frames, with video data at 30fps. The data is stored in parquet format and includes robot actions and state observations, specifically the positions of 7 joints (shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_yaw.pos, wrist_roll.pos, gripper.pos). Additionally, the dataset includes video data from a side view (880x640 resolution) and a hand view (480x640 resolution), encoded in av1 format with yuv420p pixel format and no audio.
提供机构:
Lakesenberg
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是驱动算法进步的关键。Seeed_Hackathon_egg_1 数据集采用 LeRobot 框架构建,通过 Seeed B601 DM 从动机器人采集完成。数据集包含 20 个完整操作片段,共计 14980 帧数据,以 30 帧每秒的速率记录。数据以 Parquet 格式存储,分为多个区块(chunk),每个区块包含若干文件,同时伴有 AV1 编码的 mp4 视频文件,涵盖侧方与手部两个视角的视觉信息。
特点
该数据集的核心特点在于其精细的机器人状态与动作记录。动作与观测状态均包含 7 维关节空间信息,涵盖肩部、肘部、腕部及夹爪的位姿参数。视觉部分提供 880×640 与 480×640 两种分辨率的侧面和手部图像,为模仿学习提供了丰富的多模态输入。数据还携带时间戳、帧索引、片段索引等结构化信息,便于时序建模与任务复现。整体数据集规模紧凑,便于快速迭代与实验验证。
使用方法
使用该数据集时,可借助 LeRobot 库进行加载与预处理。数据按片段组织,20 个片段全部划归训练集,适合进行行为克隆或强化学习训练。用户需关注 Parquet 文件中的动作与状态列,通过序列方式读取帧数据,同时配合对应的视频帧进行视觉特征提取。数据集遵循 Apache-2.0 许可,适合学术研究与开源项目。建议先通过 LeRobot 的 Dataset 类加载 meta/info.json,再迭代访问各片段数据以复现机器人操作轨迹。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习对高质量、结构化的演示数据需求日益迫切,而真实物理环境中获取机器人操作数据常受限于设备复杂性与采集成本。Seeed_Hackathon_egg_1数据集由Seeed Studio团队在Hackathon活动中创建,基于LeRobot框架采集,旨在为机械臂操作任务提供标准化训练样本。该数据集围绕单任务场景(如抓取与放置鸡蛋类易碎物品)记录20个操作回合,包含14980帧多模态数据,涵盖7自由度关节动作状态、侧视与手部摄像头视频流及时间戳信息。数据集采用Apache-2.0协议开源,其结构化格式(按序化数据分块、视频与状态同步记录)为机器人策略模型(如行为克隆、扩散策略)的端到端训练提供了可靠基础,降低了机器人研究入门门槛,促进了社区协作与可复现性。
当前挑战
该数据集主要应对两大挑战:其一,机器人操作任务中精细动作的泛化性问题——尤其是涉及易碎物品的抓取任务,依赖高精度力控与视觉反馈协调,现有数据集常缺乏此类细粒度动作与场景多样性,导致模型在真实环境迁移时表现脆弱;其二,数据采集与标注的高成本壁垒——传统演示采集需昂贵遥操作设备或专业标注工具,而该数据集通过低成本的Seeed B601机械臂结合LeRobot框架,提供标准化采集流程,但受限于20个回合的小规模样本,仍需解决单任务数据集少样本下的过拟合风险、视觉域差(如光照、背景变化)适应性不足,以及多模态时空数据(30fps视频与100MB状态序列)的高效预处理与云端协同存储挑战。
常用场景
经典使用场景
在机器人学习领域,Seeed_Hackathon_egg_1数据集为模仿学习与行为克隆研究提供了珍贵的实验素材。该数据集采集自Seeed B601双臂协作机器人,包含20个完整演示片段,总计近15000帧的高频交互数据,采样频率为30赫兹。其核心用途在于训练机器人从视觉观测与本体感知信息中习得精细操作策略,尤其适用于涉及双视角视觉输入(侧方与手部摄像头)的复杂任务场景,为构建端到端的机器人操控模型奠定了数据基础。
衍生相关工作
依托该数据集,研究者已衍生了多项重要工作,包括将扩散策略(Diffusion Policy)应用于机器人动作生成、利用预训练视觉编码器进行状态表征学习,以及开发基于LeRobot框架的跨任务迁移方法。此外,该数据集还被用于验证模型预测控制(MPC)与模仿学习相结合的策略优化方案,在机器人社区内推动了低成本硬件与开源数据闭环的研究范式发展。
数据集最近研究
最新研究方向
该数据集源自Seeed黑客松竞赛,聚焦于机器人操作技能的模仿学习,依托LeRobot框架与Seeed B601差分驱动机械臂平台。当前前沿方向围绕低成本、高泛化能力的机器人数据采集与策略迁移展开,结合20个演示片段与多视角视觉输入(侧面与手部摄像头),推动小样本学习在精细操作任务中的应用。该数据集与开源机器人社区中实体AI(Embodied AI)的热潮紧密相连,强调通过标准化数据格式与Apache-2.0许可降低重复造轮子的门槛,加速从仿真到真机的技能复制。其意义在于为机器人学习提供可复现的基准数据,并启发更多人机协作与工业自动化在动态环境中的适应策略。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作