rgragulraj/policy1_diverse_session_c

Name: rgragulraj/policy1_diverse_session_c
Creator: rgragulraj
Published: 2026-04-11 02:32:04
License: 暂无描述

Hugging Face2026-04-11 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/rgragulraj/policy1_diverse_session_c

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot - so101 - precision - insertion - policy1 configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "so101_follower", "total_episodes": 50, "total_frames": 31653, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:50" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.state": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.images.gripper": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.top": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

rgragulraj

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于策略学习至关重要。policy1_diverse_session_c数据集依托LeRobot框架构建，通过so101_follower型机器人执行单一任务，采集了50个完整交互片段，共计31653帧数据。数据以Parquet格式分块存储，每块包含1000帧，确保了高效的数据管理与读取。同时，数据集同步记录了机器人关节状态、夹爪及顶部视角的视频流，帧率为30fps，为机器人控制与视觉感知研究提供了丰富的多模态信息源。

特点

该数据集的核心特点体现在其多维度的数据表征与精心的结构设计上。特征层面，不仅包含六维关节位置的动作指令与状态观测，还整合了夹爪与顶部双视角的RGB视频流，视频采用AV1编码以平衡质量与存储效率。数据结构上，通过帧索引、片段索引等元数据实现了精细的时序与上下文关联，所有数据均以标准化格式组织，便于直接用于端到端的机器人策略训练或行为克隆研究，展现了其在机器人学习任务中的实用性与先进性。

使用方法

为有效利用该数据集进行机器人学习研究，使用者可通过LeRobot库或兼容的数据加载工具读取Parquet文件。数据已预设为训练集，涵盖全部50个交互片段。研究过程中，可同步调用关节状态、动作指令及双视角视频序列，以构建状态-动作对用于监督学习或强化学习。视频数据与状态数据通过时间戳严格对齐，支持跨模态融合模型的开发。数据集遵循Apache 2.0许可，允许广泛的学术与商业用途，为机器人精确操作与策略泛化提供了可靠的基础数据支撑。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习策略的泛化能力提升，依赖于高质量、多样化的真实世界交互数据。policy1_diverse_session_c数据集由Hugging Face的LeRobot项目团队构建，旨在为机器人操作任务，特别是精密插入等精细操控行为，提供丰富的示范轨迹。该数据集采集自so101_follower型机器人平台，包含50个完整交互片段，共计超过三万帧的多模态观测数据，融合了关节状态、夹爪及顶部视角视频流，为端到端策略学习与视觉运动控制研究奠定了数据基础。其创建顺应了数据驱动机器人学的发展趋势，通过开源共享促进了社区在真实场景策略泛化与样本效率方面的探索。

当前挑战

该数据集致力于应对机器人精密操作任务中策略泛化与样本效率的核心挑战。在领域层面，精细插入等任务对动作的毫米级精度与复杂接触动力学建模提出极高要求，而视觉观测中的遮挡、光照变化及物体姿态多样性，进一步增加了从像素到动作的映射学习难度。在构建过程中，数据采集需协调多传感器同步，确保关节状态、视频流与时间戳的高频对齐，同时维持长时间操作的稳定性与一致性。此外，标注与清洗大规模真实机器人交互数据耗时巨大，且需保证任务执行的多样性与覆盖度，以支撑策略在未见场景中的有效泛化。

常用场景

经典使用场景

在机器人学领域，policy1_diverse_session_c数据集为机器人操作任务提供了丰富的多模态数据资源。该数据集通过记录SO101型机器人在执行精密插入任务过程中的关节位置、夹爪状态以及多视角视觉信息，典型地应用于机器人策略学习与行为模仿研究。研究者能够利用这些数据训练端到端的控制模型，使机器人学习从原始传感器输入到动作输出的映射关系，从而在复杂环境中实现精准的物体操控。

衍生相关工作

围绕该数据集，已衍生出多项关于机器人视觉运动策略学习的经典研究工作。例如，研究者利用其多模态序列数据开发了基于Transformer的时空预测模型，用于长时程动作规划。同时，该数据集也常被用作基准，用于比较行为克隆、逆强化学习以及离线强化学习等不同范式在真实机器人任务上的表现，催生了多种高效的数据复用与策略改进算法。

数据集最近研究