gravta42/Lerobot_move_white_tube_rack_to_other_rack_Lcam

Name: gravta42/Lerobot_move_white_tube_rack_to_other_rack_Lcam
Creator: gravta42
Published: 2026-04-11 04:07:59
License: 暂无描述

Hugging Face2026-04-11 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/gravta42/Lerobot_move_white_tube_rack_to_other_rack_Lcam

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=gravta42/Lerobot_move_white_tube_rack_to_other_rack_Lcam"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "so_follower", "total_episodes": 11, "total_frames": 4054, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:11" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.state": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.images.stereo": { "dtype": "video", "shape": [ 240, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 240, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.top_L": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

gravta42

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于实际物理系统的交互记录。本数据集通过LeRobot平台，在真实机器人环境中采集了机械臂执行特定任务的过程。数据采集涉及一个名为“so_follower”的机器人类型，共记录了11个完整任务片段，总计4054帧数据，以每秒30帧的速率捕捉。数据以分块形式存储，每块包含1000帧，整体数据文件规模约为100MB，视频文件则达到200MB。这种构建方式确保了数据的时序连续性与任务完整性，为后续分析提供了扎实的基础。

特点

该数据集的特点体现在其多模态数据结构的精心设计上。观测数据不仅包含机械臂六个关节的位置状态，还融合了立体视觉和顶部左视角的图像信息，图像分辨率分别为240x640和480x640，均以彩色视频形式编码。动作数据同样以六维浮点向量表征，与观测状态维度一致，便于建立状态-动作映射关系。数据集采用Parquet格式高效存储，并辅以MP4格式的视频文件，支持对机器人操作过程的直观可视化。这种结构化的特征组织为机器人学习算法的训练与验证提供了丰富而一致的输入输出对。

使用方法

使用本数据集时，研究者可通过LeRobot提供的工具链直接加载与处理数据。数据集已按训练集划分，涵盖全部11个任务片段，适用于机器人模仿学习、强化学习或行为克隆等任务的模型训练。数据加载路径遵循明确的命名规范，可通过指定块索引与文件索引访问具体的Parquet数据文件。同时，配套的视频文件允许用户直观审视机械臂的操作轨迹与环境交互。在具体应用中，可提取观测图像与关节状态作为模型输入，并以记录的动作作为监督信号，从而训练机器人完成类似的物体转移任务。

背景与挑战

背景概述

在机器人操作学习领域，模仿学习与强化学习等方法依赖于高质量、任务特定的示范数据。Lerobot_move_white_tube_rack_to_other_rack_Lcam数据集应运而生，由Hugging Face的LeRobot项目团队创建，旨在为机械臂执行精细物体操作任务提供真实世界交互记录。该数据集聚焦于将白色试管架移至另一支架的单一任务，通过集成多视角视觉观测与关节状态数据，捕捉了机器人动作与环境反馈的时序关联，为端到端策略学习提供了关键数据支撑。其构建体现了开源社区推动机器人学习数据共享与标准化的重要努力，有望促进家庭与服务场景中灵巧操作算法的实证研究。

当前挑战

该数据集致力于解决机器人操作中基于视觉的精细抓取与放置任务，其核心挑战在于如何从高维视觉输入中有效提取与动作规划相关的特征，并实现跨视角、跨实例的泛化能力。数据构建过程中，面临多传感器同步校准、长时序动作序列的连续标注以及真实环境光照、遮挡等干扰因素带来的数据噪声问题。此外，数据集规模相对有限，仅包含11个演示片段，可能制约了复杂模型训练与稳健策略学习，对数据增强与迁移学习提出了更高要求。

常用场景

经典使用场景

在机器人操作学习领域，该数据集为机械臂执行精细物体转移任务提供了典型范例。其核心场景涉及利用多视角视觉观测与关节状态数据，训练模型控制六自由度机械臂完成白色试管架在支架间的精准搬运。这一过程融合了立体视觉与顶部摄像头信息，模拟了实验室或工业环境中常见的物料整理操作，为端到端模仿学习算法的验证与优化奠定了数据基础。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在视觉模仿学习与多模态策略网络架构的创新上。例如，基于LeRobot框架的研究常借鉴行为克隆与逆强化学习思路，开发能够从有限演示中提取时空特征的神经网络模型。相关进展包括融合Transformer的序列预测方法、基于扩散模型的策略生成技术，以及针对机械臂操作的视觉里程计辅助训练方案，这些工作共同推动了机器人学习社区在真实世界任务上的算法迭代与性能突破。

数据集最近研究