niklashcs/Square_D1_square_d1_2026-04-10_21-14-54
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/niklashcs/Square_D1_square_d1_2026-04-10_21-14-54
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- robotics
tags:
- LeRobot
configs:
- config_name: default
data_files: data/*/*.parquet
---
This dataset was created using [LeRobot](https://github.com/huggingface/lerobot).
<a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=niklashcs/Square_D1_square_d1_2026-04-10_21-14-54">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/>
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/>
</a>
## Dataset Description
- **Homepage:** [More Information Needed]
- **Paper:** [More Information Needed]
- **License:** apache-2.0
## Dataset Structure
[meta/info.json](meta/info.json):
```json
{
"codebase_version": "v3.0",
"robot_type": "robomimic",
"total_episodes": 500,
"total_frames": 75909,
"total_tasks": 1,
"chunks_size": 1000,
"data_files_size_in_mb": 100,
"video_files_size_in_mb": 200,
"fps": 20,
"splits": {
"train": "0:500"
},
"data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet",
"video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4",
"features": {
"action": {
"dtype": "float32",
"shape": [
7
],
"names": [
"eef_delta_pos_x",
"eef_delta_pos_y",
"eef_delta_pos_z",
"eef_delta_rot_rx",
"eef_delta_rot_ry",
"eef_delta_rot_rz",
"gripper_action"
]
},
"next.done": {
"dtype": "bool",
"shape": [
1
],
"names": [
"done"
]
},
"observation.state": {
"dtype": "float32",
"shape": [
8
],
"names": [
"robot0_eef_pos_0",
"robot0_eef_pos_1",
"robot0_eef_pos_2",
"robot0_eef_quat_0",
"robot0_eef_quat_1",
"robot0_eef_quat_2",
"robot0_eef_quat_3",
"robot0_gripper_qpos_0"
]
},
"observation.state.eef_pos": {
"dtype": "float32",
"shape": [
3
],
"names": [
"robot0_eef_pos_0",
"robot0_eef_pos_1",
"robot0_eef_pos_2"
]
},
"observation.state.eef_quat": {
"dtype": "float32",
"shape": [
4
],
"names": [
"robot0_eef_quat_0",
"robot0_eef_quat_1",
"robot0_eef_quat_2",
"robot0_eef_quat_3"
]
},
"observation.state.gripper_qpos": {
"dtype": "float32",
"shape": [
1
],
"names": [
"robot0_gripper_qpos_0"
]
},
"observation.state.object": {
"dtype": "float32",
"shape": [
17
],
"names": [
"object_0",
"object_1",
"object_2",
"object_3",
"object_4",
"object_5",
"object_6",
"object_7",
"object_8",
"object_9",
"object_10",
"object_11",
"object_12",
"object_13",
"object_14",
"object_15",
"object_16"
]
},
"observation.images.top": {
"dtype": "video",
"shape": [
84,
84,
3
],
"names": [
"height",
"width",
"channel"
],
"info": {
"video.height": 84,
"video.width": 84,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 20,
"video.channels": 3,
"has_audio": false
}
},
"observation.images.wrist": {
"dtype": "video",
"shape": [
84,
84,
3
],
"names": [
"height",
"width",
"channel"
],
"info": {
"video.height": 84,
"video.width": 84,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 20,
"video.channels": 3,
"has_audio": false
}
},
"timestamp": {
"dtype": "float32",
"shape": [
1
],
"names": null
},
"frame_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"episode_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"task_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
}
}
}
```
## Citation
**BibTeX:**
```bibtex
[More Information Needed]
```
提供机构:
niklashcs
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集对于算法训练至关重要。Square_D1_square_d1_2026-04-10_21-14-54数据集依托LeRobot平台构建,采用了Robomimic机器人框架进行数据采集。该数据集包含500个完整任务片段,总计75909帧数据,以20帧每秒的速率记录。数据以分块形式存储,每个块包含1000帧,并以Parquet格式组织,确保了高效的数据读取与存储管理。采集过程同步记录了机器人的末端执行器位姿、夹爪状态以及多视角视觉信息,为后续的模仿学习与强化学习研究提供了结构化的数据基础。
特点
该数据集在机器人操作任务中展现出多维度的数据表征能力。其核心特征在于融合了高维状态观测与多模态感知信息,不仅包含7维动作空间和8维机器人状态,还整合了17维物体状态描述。视觉数据方面,提供了顶部与腕部双视角的RGB视频流,分辨率均为84x84,采用AV1编码压缩以平衡质量与存储效率。数据集结构设计严谨,通过时间戳、帧索引与片段索引实现了数据的精确对齐,支持端到端的序列学习。这种丰富且对齐的多模态特性,使其特别适用于复杂策略的仿真与验证。
使用方法
研究者可通过HuggingFace数据集库直接加载该数据集,利用其预定义的数据分割进行模型训练与评估。数据以Parquet文件形式提供,可通过标准数据管道读取,并依据特征描述解析动作、观测及视觉流。在具体应用中,可结合LeRobot提供的可视化工具直观审视任务执行过程,辅助算法调试。该数据集适用于模仿学习、行为克隆及离线强化学习等任务,通过整合状态与图像观测,能够训练端到端的机器人控制策略。其标准化格式确保了与主流机器人学习框架的兼容性,加速研究迭代进程。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。Square_D1_square_d1_2026-04-10_21-14-54数据集由HuggingFace的LeRobot项目于2026年创建,旨在为机器人操作任务提供丰富的多模态演示数据。该数据集依托Robomimic框架,收录了涉及单一任务的500条轨迹,共计超过七万五千帧数据,涵盖了机械臂末端执行器的位姿、动作指令以及来自顶部与腕部摄像头的视觉观测。其核心研究问题聚焦于如何通过真实交互数据提升机器人对复杂操作技能的学习泛化能力,为机器人自主执行精细操作任务奠定了数据基础,对推动具身智能的发展具有显著影响力。
当前挑战
该数据集致力于解决机器人模仿学习中从演示数据学习精细操作策略的挑战,其核心问题在于如何从高维、异构的多模态观测(如视觉图像与本体状态)中有效提取特征,并生成精确、稳定的连续控制动作。在构建过程中,挑战主要体现在数据采集的规模与质量上:确保长达五百条轨迹的演示数据在动作指令与状态观测之间保持时序一致性与物理真实性,同时处理并压缩大量高帧率视频数据以平衡存储效率与信息完整性。此外,在单一任务设定下,数据需充分覆盖任务执行中的状态空间变化,以避免学习策略的过拟合,这对数据采集协议的设计与后期清洗提出了较高要求。
常用场景
经典使用场景
在机器人操作领域,Square_D1_square_d1_2026-04-10_21-14-54数据集为模仿学习与强化学习算法提供了丰富的实验基础。该数据集通过RoboMimic框架收集了500个任务片段,包含末端执行器位置、姿态、夹爪状态及多视角视觉观测,常用于训练机器人执行精确的物体操作任务,如抓取、放置或装配。研究者利用其结构化动作与观测序列,开发能够从人类演示中学习复杂技能的智能体,推动机器人自主行为生成技术的发展。
解决学术问题
该数据集有效解决了机器人学中样本效率低下与泛化能力不足的学术挑战。通过提供大规模、多模态的演示数据,它支持端到端策略学习,减少对昂贵真实世界交互的依赖。其包含的视觉与状态信息促进了感知-动作映射模型的构建,有助于探索跨任务迁移、多模态融合以及长期序列预测等核心问题,为机器人适应动态环境提供了实证基础。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在模仿学习框架的优化与多任务策略泛化。例如,基于RoboMimic的扩展方法改进了行为克隆与逆强化学习的性能;同时,结合视觉Transformer的架构利用其图像序列增强了空间推理能力。这些工作不仅提升了数据利用率,还推动了开源机器人社区如LeRobot的工具链发展,为后续大规模机器人数据集的标准化奠定了基础。
以上内容由遇见数据集搜集并总结生成



