homerobotics-lerobot-50hz
收藏Hugging Face2026-03-09 更新2026-03-10 收录
下载链接:
https://huggingface.co/datasets/maksimgorki/homerobotics-lerobot-50hz
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot项目创建,专为机器人技术研究设计。数据集包含93个任务片段,总计93,419帧数据,数据存储为parquet格式。数据集包含动作和观测数据,动作数据包括12个关节的位置信息(如左肩、右肩、肘部、手腕等),观测数据包括机器人状态和三个视角的视频数据(左、中、右)。视频数据分辨率为480x640,帧率为50fps,编码格式为AV1。数据集适用于机器人控制、行为模仿等任务,采用Apache-2.0许可证。
创建时间:
2026-03-03
原始信息汇总
数据集概述
基本信息
- 数据集名称: maksimgorki/homerobotics-lerobot-50hz
- 创建工具: 使用 LeRobot 创建。
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 数据格式: Parquet 文件
- 配置名称: default
- 数据文件路径模式:
data/*/*.parquet - 总数据量: 100 MB
- 总视频量: 200 MB
数据集统计
- 总情节数: 93
- 总帧数: 93,419
- 总任务数: 1
- 数据块大小: 1000
- 帧率: 50 Hz
- 数据分割: 训练集(索引 0 至 93)
特征描述
动作特征
- 名称:
action - 数据类型:
float32 - 形状: [12]
- 描述: 包含12个关节位置指令,具体为左、右机械臂的肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置。
状态观测特征
- 名称:
observation.state - 数据类型:
float32 - 形状: [12]
- 描述: 包含12个关节位置观测,具体为左、右机械臂的肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置。
图像观测特征
- 左夹爪左侧图像:
- 名称:
observation.images.left_gripper_left - 数据类型:
video - 形状: [480, 640, 3]
- 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,50帧/秒,无音频。
- 名称:
- 左中部图像:
- 名称:
observation.images.left_middle - 数据类型:
video - 形状: [480, 640, 3]
- 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,50帧/秒,无音频。
- 名称:
- 右夹爪右侧图像:
- 名称:
observation.images.right_gripper_right - 数据类型:
video - 形状: [480, 640, 3]
- 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,50帧/秒,无音频。
- 名称:
索引与时间戳特征
- 时间戳:
timestamp,数据类型float32,形状 [1]。 - 帧索引:
frame_index,数据类型int64,形状 [1]。 - 情节索引:
episode_index,数据类型int64,形状 [1]。 - 索引:
index,数据类型int64,形状 [1]。 - 任务索引:
task_index,数据类型int64,形状 [1]。
文件路径模式
- 数据文件路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
代码库版本
- 版本: v3.0
机器人类型
- 类型: bi_so_follower
引用信息
- 主页: [More Information Needed]
- 论文: [More Information Needed]
- BibTeX 引用: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集对于模型训练至关重要。homerobotics-lerobot-50hz数据集依托LeRobot平台构建,通过双手机器人系统采集了93个完整任务片段,总计包含93419帧数据。数据以50赫兹的频率同步记录,采用分块存储策略,每个数据块包含1000帧,并以Parquet格式高效保存,同时配有对应的视频文件,确保了时序信息与视觉观测的完整性。
特点
该数据集在机器人操作任务中展现出显著的多模态特性,不仅提供了12维的双臂关节位置作为动作与状态观测,还整合了来自左、中、右三个视角的RGB视频流,分辨率均为640x480。所有数据均以50帧每秒的高速率采集,保证了动态过程的精细刻画。数据集结构清晰,通过索引字段可便捷追踪帧、片段及任务层级,为模仿学习与强化学习算法提供了丰富的训练素材。
使用方法
研究人员可利用LeRobot工具链直接加载并可视化此数据集,其标准化的Parquet格式便于通过Python数据处理库进行读取与处理。数据按训练集划分,涵盖全部93个片段,用户可依据帧索引或片段索引提取对应的关节状态、动作指令及多视角图像序列,进而用于行为克隆、动态模型学习等机器人学习任务的训练与评估。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。homerobotics-lerobot-50hz数据集由HuggingFace的LeRobot项目团队构建,旨在为双臂机器人(bi_so_follower型)提供精细的操作演示数据。该数据集以50Hz的高频率同步采集了机器人的关节状态、多视角视觉观测以及对应的控制动作,涵盖了93个完整任务片段,总计超过九万帧数据。其核心研究问题聚焦于如何利用真实世界的多模态时序数据来训练机器人执行复杂的双手协调操作任务,从而弥合仿真环境与物理部署之间的鸿沟,对机器人技能学习领域具有重要的实证研究价值。
当前挑战
该数据集致力于解决机器人操作技能学习中的核心挑战,即如何从高维、异构的感官输入(如多摄像头视频和关节角度)中有效学习出鲁棒且泛化能力强的控制策略。具体挑战包括处理高频率(50Hz)时序数据带来的长程依赖建模困难,以及融合视觉感知与本体感知以实现精确的动作预测。在构建过程中,挑战主要源于真实世界数据采集的复杂性,例如确保多传感器(多个摄像头与关节编码器)之间的严格时间同步、维持长时间数据采集的稳定性与一致性,以及管理和存储大规模视频与状态数据所引发的巨大计算与存储开销。
常用场景
经典使用场景
在机器人学习领域,homerobotics-lerobot-50hz数据集以其高频率的传感器数据采集和丰富的多模态信息,成为训练双臂仿人机器人执行复杂操作任务的经典资源。该数据集通过整合关节位置状态、多视角视觉图像以及时间序列标记,为研究人员提供了一个模拟真实家庭环境交互场景的基准平台,特别适用于开发基于模仿学习或强化学习的机器人控制策略,以实现在非结构化环境中的灵巧操作。
解决学术问题
该数据集有效应对了机器人学中关于高维连续动作空间下策略学习的核心挑战,通过提供大规模、高帧率的真实世界交互数据,缓解了仿真与现实之间的鸿沟问题。它使得学者能够深入探究多传感器融合、时序决策建模以及跨模态表示学习等前沿课题,为提升机器人在动态环境中的自适应能力和泛化性能奠定了坚实的数据基础,推动了具身智能研究向更实用化方向发展。
衍生相关工作
围绕该数据集,研究社区已经衍生出一系列经典工作,主要集中在端到端机器人控制架构的设计与优化上。例如,利用其多模态序列数据开发基于Transformer的决策模型,或者结合逆动力学学习进行行为克隆。这些工作不仅验证了数据集在推动模仿学习与离线强化学习算法进步方面的价值,还促进了开源机器人学习框架的生态建设,为后续大规模机器人数据集的构建与标准化提供了重要参考。
以上内容由遇见数据集搜集并总结生成



