rgragulraj/policy1_diverse_session_a

Name: rgragulraj/policy1_diverse_session_a
Creator: rgragulraj
Published: 2026-04-10 20:21:34
License: 暂无描述

Hugging Face2026-04-10 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/rgragulraj/policy1_diverse_session_a

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot - so101 - precision - insertion - policy1 configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "so101_follower", "total_episodes": 50, "total_frames": 34900, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:50" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.state": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.images.gripper": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.top": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

rgragulraj

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动策略学习与行为模仿研究至关重要。policy1_diverse_session_a数据集依托LeRobot平台构建，其采集过程聚焦于单一任务场景，通过SO101型跟随机器人执行精密插入操作，系统记录了50个完整交互片段。数据以每秒30帧的速率同步捕获多模态信息，涵盖机器人关节状态、末端执行器动作以及双视角视觉流，并以分块Parquet格式高效存储，确保了时序对齐与数据完整性。

特点

该数据集的核心特征体现在其精心设计的结构化表示与丰富的感知维度。数据架构清晰划分了动作空间与观测空间，动作向量精确编码了六自由度机械臂的关节位置与夹爪状态；观测部分则融合了本体关节状态与双路高清视频流，分别来自夹爪摄像头与顶部固定视角，提供了互补的场景理解。时序索引与片段标识符的引入，使得长序列任务的分析与离线强化学习训练更为便捷，而统一的Av1编码视频格式在保证视觉质量的同时优化了存储效率。

使用方法

为有效利用该数据集进行机器人策略学习研究，用户需遵循其固有的数据加载范式。数据集已预划分为训练集，可通过解析meta/info.json中的路径模板，按块加载Parquet文件以获取结构化数据与对应视频帧。研究者可基于观测图像与状态序列训练视觉运动策略模型，或利用动作标签进行行为克隆与逆向强化学习。数据的高帧率与多视角特性也支持时序预测、场景理解等衍生任务，为算法验证与比较提供了标准化基准。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习策略的泛化能力是推动机器人适应复杂现实环境的核心研究议题。policy1_diverse_session_a数据集由HuggingFace的LeRobot项目创建，旨在为机器人操作任务提供高质量、多样化的演示数据。该数据集聚焦于精密插入任务，采用so101_follower机器人平台，记录了包含关节状态、夹爪及顶部视角视频的多模态观测数据与对应动作序列。其构建体现了学术界对数据驱动机器人策略开发的持续探索，通过开源共享促进机器人社区在真实世界技能学习方面的协作与创新。

当前挑战

该数据集致力于解决机器人精密操作任务中策略泛化与鲁棒性提升的挑战，其核心在于如何从有限演示中学习能够适应环境变化与干扰的插入策略。在构建过程中，面临多模态数据的高效同步与对齐难题，需确保关节状态、视觉信息与动作指令在时序上精确一致。同时，数据采集需覆盖操作场景的多样性，以克服现实世界中的物体位姿变化、光照条件波动及机械误差等因素，这对实验设计与数据清洗提出了较高要求。

常用场景

经典使用场景

在机器人操作领域，policy1_diverse_session_a数据集为机器人策略学习提供了丰富的实验数据。该数据集通过记录SO101型跟随机器人在执行精密插入任务时的多模态观测数据，包括关节位置状态和来自顶部与夹爪视角的视频流，为模仿学习与强化学习算法的训练与验证奠定了坚实基础。研究人员能够利用这些数据构建端到端的控制模型，模拟真实环境中的动态交互过程，从而优化机器人在复杂操作任务中的决策能力。

实际应用

在实际工业自动化场景中，policy1_diverse_session_a数据集能够直接应用于精密装配与插接工序的机器人系统开发。基于该数据集训练的模型可赋能工业机器人执行诸如电子元件插装、精密零件对接等需要亚毫米级精度的任务。通过迁移学习技术，这些模型能够适应不同生产线上的类似操作，显著提升生产流程的自动化水平与灵活性，降低对人工示教的依赖，实现高效稳定的智能制造。

衍生相关工作

围绕该数据集，已衍生出一系列专注于机器人视觉运动策略的前沿研究。经典工作包括基于时空注意力机制的模仿学习框架，以及融合多视角视觉信息的端到端强化学习算法。这些研究充分利用数据集提供的同步视频与状态序列，探索了跨模态表征学习、策略蒸馏与领域自适应等关键技术，为构建更鲁棒、更通用的机器人操作智能体提供了重要参考与启发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集