ankile/square-d1-dagger-sobol-v1-r12

Name: ankile/square-d1-dagger-sobol-v1-r12
Creator: ankile
Published: 2026-04-10 14:35:52
License: 暂无描述

Hugging Face2026-04-10 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/ankile/square-d1-dagger-sobol-v1-r12

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "panda", "total_episodes": 100, "total_frames": 22571, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 20, "splits": { "train": "0:100" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "observation.state": { "dtype": "float32", "shape": [ 9 ], "names": [ "eef_pos_x", "eef_pos_y", "eef_pos_z", "eef_quat_x", "eef_quat_y", "eef_quat_z", "eef_quat_w", "gripper_qpos_left", "gripper_qpos_right" ] }, "observation.environment_state": { "dtype": "float32", "shape": [ 17 ], "names": [ "nut_to_eef_pos_x", "nut_to_eef_pos_y", "nut_to_eef_pos_z", "nut_to_eef_quat_x", "nut_to_eef_quat_y", "nut_to_eef_quat_z", "nut_to_eef_quat_w", "nut_pos_x", "nut_pos_y", "nut_pos_z", "nut_quat_x", "nut_quat_y", "nut_quat_z", "nut_quat_w", "peg_pos_x", "peg_pos_y", "peg_pos_z" ] }, "action": { "dtype": "float32", "shape": [ 7 ], "names": [ "delta_eef_pos_x", "delta_eef_pos_y", "delta_eef_pos_z", "delta_eef_rot_x", "delta_eef_rot_y", "delta_eef_rot_z", "gripper_action" ] }, "source": { "dtype": "int64", "shape": [ 1 ], "names": [ "source_id" ] }, "success": { "dtype": "int64", "shape": [ 1 ], "names": [ "success_flag" ] }, "intervention": { "dtype": "int64", "shape": [ 1 ], "names": [ "intervention_flag" ] }, "is_valid": { "dtype": "int64", "shape": [ 1 ], "names": [ "is_valid_flag" ] }, "reward": { "dtype": "float32", "shape": [ 1 ], "names": [ "reward" ] }, "done": { "dtype": "int64", "shape": [ 1 ], "names": [ "done_flag" ] }, "observation.images.agentview": { "dtype": "video", "shape": [ 256, 256, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 256, "video.width": 256, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 20, "video.channels": 3, "has_audio": false } }, "observation.images.robot0_eye_in_hand": { "dtype": "video", "shape": [ 256, 256, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 256, "video.width": 256, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 20, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

ankile

搜集汇总

数据集介绍

构建方式

该数据集基于LeRobot框架构建，旨在为机器人操作任务提供高质量的训练数据。通过结合平方核距离（square-d1）、dagger算法与sobol采样策略，在Franka Emika Panda机械臂平台上采集了100个完整回合（episode）的演示数据，共包含22,571帧。数据以Parquet格式存储，并配有相应的高清视频记录，确保信息完整性与可复现性。训练集与全部数据重合，便于直接用于策略学习。

特点

数据集的一大特色在于其多元化的特征维度，涵盖了机器人状态、环境状态及动作向量等关键信息。机器人状态包括末端执行器位置与姿态、夹爪开合度等9维浮点数据；环境状态则包含螺母与销钉的相对位姿等17维信息。动作空间为7维，由位置增量与夹爪指令构成。此外，还内置了成功标志、干预标志、奖励与终止等关键标签，极大提升了数据在模仿学习与强化学习任务中的可用性。

使用方法

本数据集可直接通过LeRobot库加载使用，支持以20帧/秒的速率回放与处理数据。用户可通过指定默认配置（default）读取Parquet格式的分块数据及对应视频。建议采用深度学习框架（如PyTorch）结合LeRobot的DataLoader进行批次采样，以高效训练机器人操作策略。成功标志与干预信息可用于细化奖励设计，奖励字段则便于直接进行离线强化学习评估。

背景与挑战

背景概述

该数据集是基于LeRobot框架构建的机器人操作数据集，创建时间可追溯至现代机器人学习领域快速发展阶段，其主导机构为Hugging Face团队。核心研究问题聚焦于通过模仿学习与数据驱动方法，解决高精度轴孔装配任务（如nut-in-pegs操作）。数据集采用Franka Emika Panda机械臂，采集了100个示范回合，总计22571帧20Hz的时序数据，涵盖机器人末端执行器位姿、夹爪状态及环境物件位置等丰富状态信息，并配备成功标志与干预标志，为机器人技能学习提供了标准化基准。其对领域的影响在于降低机器人数据采集门槛，推动开源社区在模仿学习、行为克隆等方向的实证研究，尤其为研究小样本下的策略泛化能力提供了关键资源。

当前挑战

该数据集所解决的领域问题在于：机器人装配任务中，传统手工编程难以应对复杂接触动力学与精细操作要求，需通过示范学习实现自适应控制。具体挑战包括：1）模仿学习的策略泛化能力不足，数据集仅覆盖100个回合，环境状态与物件位姿的微小变化可能导致任务失败；2）高维观测空间（9维状态与17维环境特征）与连续动作空间（7维控制信号）之间的映射关系复杂，现有算法易陷入局部最优；3）构建过程中需平衡数据质量与采集效率，依赖精确的末端位姿标定与干预记录，若动作执行与示范策略存在偏差，则会导致无效数据累积。

常用场景

经典使用场景

在机器人学习与模仿学习领域，square-d1-dagger-sobol-v1-r12数据集为基于视觉和状态输入的机械臂精细化操作研究提供了宝贵的资源。该数据集记录了Franka Emika Panda机械臂在螺母-螺栓装配任务中的100个完整回合，包含约2.2万帧高保真数据，涵盖了末端执行器位姿、夹爪状态、环境物体相对位置等多模态观测信息。其经典使用场景是通过行为克隆或逆强化学习方法，从专家演示中学习精确的抓取与装配策略，以提升机器人在复杂工业场景下的自主作业能力。

解决学术问题

该数据集的核心价值在于解决了机器人精细化装配任务中数据稀缺与泛化性不足的学术难题。传统方法多依赖手工设计的控制规则，难以应对零件位姿的微小变化。通过提供包含丰富状态变量（如螺母与螺栓的相对位移、夹爪开合度）和视觉观测的标准化数据，研究者得以系统性地探索高维状态空间下的策略学习，验证各种算法在长时域、多步骤装配任务中的有效性与鲁棒性，推动了从仿真到真实场景的迁移研究。

衍生相关工作

围绕该数据集衍生了诸多经典工作，例如基于扩散策略（Diffusion Policy）的动作生成模型，利用数据中的时序动作标签学习多模态分布，提升复杂装配动作的平滑性；还有结合离策略评估算法的研究，通过数据集中的奖励与成功与否标识来优化策略值函数。此外，sobol采样策略与DAgger框架的结合启发了高效的数据采集方法，被后续工作扩展为自演进式模仿学习范式，显著减少了专家演示的依赖并提高了样本效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集