1

Hugging Face2025-08-27 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/Thuongg2907/1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot工具创建，包含了一个机器人类型为so100_follower的任务，总共有1个剧集，22个帧，1个任务，2个视频和1个数据块。数据块大小为1000，帧率为30。数据集分为训练集，比例为0:1。数据集包含的动作和观测状态特征包括机器人关节的位置信息，以及正面和侧面的视频图像。每个视频图像的尺寸为480x640，包含3个通道，视频格式为av1，像素格式为yuv420p，没有音频。

创建时间：

2025-08-23

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集描述

创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

数据文件格式: Parquet
配置名称: default
数据文件路径: data//.parquet

元数据信息

代码库版本: v2.1
机器人类型: so100_follower
总情节数: 1
总帧数: 22
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率: 30 fps
数据分割: 训练集 (train): 0:1

数据特征

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
前视图像观测 (observation.images.front):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: 高度480px, 宽度640px, 编码器av1, 像素格式yuv420p, 非深度图, 帧率30fps, 3个通道, 无音频
侧视图像观测 (observation.images.side):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: 高度480px, 宽度640px, 编码器av1, 像素格式yuv420p, 非深度图, 帧率30fps, 3个通道, 无音频
时间戳 (timestamp): float32, 形状[1]
帧索引 (frame_index): int64, 形状[1]
情节索引 (episode_index): int64, 形状[1]
索引 (index): int64, 形状[1]
任务索引 (task_index): int64, 形状[1]

文件路径格式

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

引用信息

文献: 需要更多信息
BibTeX: 需要更多信息

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于算法训练至关重要。该数据集依托LeRobot平台构建，采用结构化数据存储格式，将机器人操作任务中的动作、状态观测及多视角图像序列整合为标准化Parquet文件。数据采集过程涵盖22帧连续操作场景，以30fps的帧率记录机械臂关节位置与视觉信息，确保时序一致性与多模态对齐。

使用方法

研究者可通过解析Parquet文件直接获取时序对齐的多模态数据流，其中动作与状态数据以float32格式存储，视频数据则通过MP4文件路径关联。数据集已预设训练分割方案，支持端到端策略学习或行为克隆任务。使用前需配置相应视频解码环境，建议结合LeRobot代码库实现数据加载与仿真验证闭环。

背景与挑战

背景概述

机器人学习领域近年来呈现出对高质量示范数据日益增长的需求，该数据集作为LeRobot项目的重要组成部分，专注于机械臂操作任务的示范数据收集。数据集采用Apache 2.0开源协议，通过多模态传感器记录SO100型机械臂的关节状态、视觉观察和动作执行数据，为模仿学习与强化学习算法提供真实世界的训练素材。其设计理念体现了将实际机器人操作经验转化为可学习表示的学术追求，旨在推动机器人技能获取技术的边界拓展。

当前挑战

该数据集致力于解决机器人操作任务中的动作表示与状态观测难题，具体挑战包括高维连续动作空间的精确建模、多视角视觉观测的时间同步与对齐、以及真实环境下的传感器噪声处理。在构建过程中面临数据采集一致性与完整性的技术障碍，需要确保不同演示任务间的数据格式统一，同时处理大规模视频数据存储与高效读取的工程挑战，以及保证示范质量的同时维持数据多样性的平衡。

常用场景

经典使用场景

在机器人学习领域，该数据集通过多模态传感器数据记录机械臂操作任务的全过程，其经典应用场景集中于模仿学习算法的训练与验证。研究者利用其包含的关节位置状态、双视角视觉观测与动作指令序列，构建端到端的策略网络模型，使机器人能够从人类示范中学习精细操作技能。

解决学术问题

该数据集有效解决了机器人模仿学习中示范数据稀缺与多模态对齐的学术难题。通过提供精确的时间同步多传感器数据，支持研究者探索状态-动作映射关系、跨模态表征学习等核心问题。其结构化设计显著促进了机器人行为克隆、逆强化学习等方向的方法创新与性能评估。

实际应用

实际应用中，该数据集为工业自动化中的机械臂控制提供了重要数据支撑。基于其训练的模型可应用于物体抓取、装配流水线操作等场景，显著降低机器人编程的复杂度。双视角视觉数据的引入进一步增强了模型在复杂环境下的适应性与鲁棒性。

数据集最近研究