record_take2

Hugging Face2026-01-19 更新2026-01-20 收录

下载链接：

https://huggingface.co/datasets/pooja420/record_take2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。包含50个episodes，总计42750帧数据，视频数据的帧率为30fps。数据集包含机器人的动作数据（如shoulder_pan.pos、shoulder_lift.pos等）、观测状态数据（与动作数据相同）、前端图像数据（480x640分辨率，3通道），以及其他元数据如时间戳、帧索引、episode索引等。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB。

创建时间：

2026-01-13

原始信息汇总

数据集概述

基本信息

数据集名称: record_take2
发布者: pooja420
许可证: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot

数据集来源

该数据集使用 LeRobot 创建。

数据集结构

总情节数: 50
总帧数: 42750
总任务数: 1
块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据拆分: 训练集（包含所有50个情节）
代码库版本: v3.0
机器人类型: so_follower

数据文件路径

数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

动作
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测图像（前视）
- 数据类型: video
- 形状: [480, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30
  - 通道数: 3
  - 包含音频: false
时间戳
- 数据类型: float32
- 形状: [1]
- 名称: null
帧索引
- 数据类型: int64
- 形状: [1]
- 名称: null
情节索引
- 数据类型: int64
- 形状: [1]
- 名称: null
索引
- 数据类型: int64
- 形状: [1]
- 名称: null
任务索引
- 数据类型: int64
- 形状: [1]
- 名称: null

补充信息

主页: 信息缺失
论文: 信息缺失
引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练至关重要。record_take2数据集依托LeRobot平台构建，通过采集真实机器人操作任务中的多模态数据，系统记录了机械臂在特定任务执行过程中的状态变化。该数据集以30帧每秒的速率捕获了42750帧数据，涵盖50个完整操作片段，数据以分块存储的Parquet格式组织，确保了高效的数据读取与处理。

特点

该数据集的特点在于其丰富的多模态信息融合，不仅包含机械臂六个关节的位置状态作为动作与观测向量，还整合了前端摄像头采集的480x640分辨率RGB视频流。数据结构的精心设计使得时间戳、帧索引与任务索引等元数据得以精确对齐，为时序分析与强化学习提供了连贯的上下文环境。这种结构化的特征表达，显著提升了数据在机器人控制与视觉感知联合建模中的可用性。

使用方法

使用record_take2数据集时，研究人员可通过LeRobot框架提供的接口加载数据，利用其预定义的数据路径与分块索引机制高效访问训练集。数据集中动作与观测向量的直接对应关系，便于构建端到端的模仿学习或强化学习模型。同时，视频流与状态数据的同步特性，支持跨模态表征学习的研究，例如从视觉输入中推断机器人状态，或生成基于视觉反馈的控制策略。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。record_take2数据集由LeRobot项目团队构建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于机械臂的轨迹控制与视觉感知，通过整合关节状态、时序动作以及前端摄像头图像，为研究者提供了一个模拟真实物理交互环境的基准平台。其核心研究问题在于如何利用演示数据提升机器人在复杂动态环境中的自主操作能力，进而推动具身智能向更通用、更鲁棒的方向发展。

当前挑战

该数据集致力于解决机器人模仿学习中从演示到泛化的核心挑战，即如何让机器人从有限的人类示范中学习，并适应未曾遇见的任务变体与环境扰动。构建过程中的挑战主要体现在数据采集的复杂性与一致性上，确保机械臂动作的精确同步、多传感器数据的对齐以及视频流的高效压缩存储，均需克服硬件噪声与软件集成的技术障碍。此外，数据标注与任务结构的稀疏性也为后续算法的泛化性能提出了严峻考验。

常用场景

经典使用场景

在机器人学习领域，record_take2数据集以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集记录了机器人执行任务过程中的关节位置、图像观测及时间序列信息，常用于训练端到端的机器人控制策略。研究者通过整合状态观测与视觉输入，能够构建鲁棒的策略模型，使机器人学习从人类演示中提取动作模式，实现精准的任务复现。

衍生相关工作

围绕record_take2数据集，衍生了一系列机器人学习领域的经典工作。这些研究聚焦于视觉-动作联合建模、跨模态表示学习以及高效模仿算法设计。例如，基于该数据集的基准测试推动了深度强化学习与行为克隆方法的融合，促进了如LeRobot等开源框架的优化，为机器人社区提供了可复现的实验平台与算法比较标准。

数据集最近研究