Lerori/dataset

Name: Lerori/dataset
Creator: Lerori
Published: 2026-05-01 06:16:41
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/Lerori/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，属于机器人领域。数据集包含150个episodes，65112帧，2个任务。数据格式包括机械臂动作（6个关节位置）、观测状态（6个关节位置）、顶部和右侧视角的图像观测（分辨率分别为600x800和480x640）、时间戳等元数据。数据集主要用于机器人控制相关的研究和应用。

This dataset was created by LeRobot and belongs to the robotics domain. It contains 150 episodes, 65112 frames, and 2 tasks. The data format includes robot actions (6 joint positions), observation states (6 joint positions), image observations from top and right-side views (with resolutions of 600x800 and 480x640 respectively), timestamps, and other metadata. The dataset is primarily intended for robotics control research and applications.

提供机构：

Lerori

搜集汇总

数据集介绍

构建方式

该数据集依托于LeRobot框架构建，专为机器人学习研究而设计。数据采集自so_follower类型的机器人，共包含281个任务轨迹，累积131406帧图像与动作序列。数据以parquet格式存储，并辅以MP4视频文件，按1000帧为一个数据块进行组织，便于高效加载与处理。数据集默认未划分验证集与测试集，全部281条轨迹用于训练，体现了对数据利用最大化的设计理念。

特点

数据集的核心特色在于多模态数据融合与精细化的机器人控制信息记录。每条轨迹均包含6维关节空间的动作指令（action）与状态观测（observation.state），同时提供两个视角的高清视频流——顶部视角（800×600像素）与右侧视角（640×480像素），以30帧/秒的帧率捕捉环境视觉信息。此外，数据集涵盖两种不同任务，索引清晰，便于进行多任务学习与迁移学习研究。

使用方法

使用者可通过LeRobot库内置的接口直接加载该数据集。借助Hugging Face提供的可视化工具，用户能够在线预览轨迹数据与视频内容。在编程实践中，建议利用LeRobot的Dataset类读取parquet文件与视频帧，构建PyTorch或TensorFlow数据加载器，用于训练模仿学习或强化学习模型。使用前需确保安装LeRobot及其依赖，数据集默认采用Apache-2.0许可证，可自由用于学术与商业研究。

背景与挑战

背景概述

该数据集由Hugging Face团队基于LeRobot框架创建，专注于机器人操作领域，旨在为模仿学习和强化学习提供高质量的演示数据。数据集包含281个演示片段，总计超过13万帧，记录了双臂机器人从多视角（顶部和右侧）执行多个任务的观测与动作序列，覆盖了肩关节、肘关节、腕关节及夹爪的连续控制信号。其出现弥补了机器人学习社区在标准化、多任务、高频率（30FPS）演示数据方面的不足，为研究从人类示教中泛化机器人技能提供了关键资源。

当前挑战

所解决的领域问题在于，机器人学习面临数据稀疏、任务单一及样本效率低下的困境，该数据集通过提供多任务、多模态（图像与关节状态）的密集演示数据，支持算法在复杂连续控制空间中学习鲁棒策略。构建过程中，挑战包括精确同步多视角摄像头的视频流与6维关节传感器的高频信号，确保时间戳与执行动作的严格对应；此外，需处理不同分辨率图像（如600×800与480×640）的标准化存储，以及超过300MB的混合数据（视频与parquet文件）的高效索引与分块管理，以支撑后续算法的可复现研究。

常用场景

经典使用场景

在机器人学习领域中，该数据集为模仿学习与行为克隆提供了高质量的演示数据。其构成要素包括六维关节空间动作指令、机器人本体状态观测以及多视角视觉图像，这些要素共同刻画了机器人执行精细操作任务的完整轨迹。借助该数据集，研究者能够训练策略网络直接映射视觉输入至动作输出，从而复现“软跟随”场景下的灵巧交互行为。数据以每秒30帧的高采样率记录，配合281个示范片段，为端到端策略学习奠定了坚实基础。

衍生相关工作

该数据集的发布催生了多项代表性工作。LeRobot框架作为数据采集与策略训练的基石工具，被广泛应用；后续研究者基于其格式开发了数据增强、预训练与跨场景迁移的系列方法。经典工作包括面向模仿学习的视觉-动作对比学习框架，以及融合时序信息的扩散策略，这些工作均以该数据集为验证平台，推动了机器人操作算法的系统性进步，也激发了社区构建更大规模、更异构的数据生态。

数据集最近研究