take69

Hugging Face2026-03-10 更新2026-03-11 收录

下载链接：

https://huggingface.co/datasets/ayatakagreentea/take69

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，专注于机器人技术领域。数据集包含71个episodes，总计34336帧数据，涉及2个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括动作数据（如肩部、肘部、腕部和夹持器的位置）、观察数据（包括状态和来自前后摄像头的图像），以及时间戳、帧索引、episode索引等元数据。图像数据的分辨率为480x640，3通道，视频编码为av1。适用于机器人控制、行为学习等研究任务。

创建时间：

2026-03-09

原始信息汇总

数据集概述

基本信息

数据集名称: take69
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

配置名称: default
数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据划分: 训练集 (0:71)

数据规模

总任务数: 2
总回合数: 71
总帧数: 34336
块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
代码库版本: v3.0
机器人类型: so_follower

数据特征

动作

数据类型: float32
形状: [6]
名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像 - 前视

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像 - 侧视

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
回合索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人学领域，数据集的构建往往依赖于真实的物理交互过程。take69数据集通过LeRobot平台采集，记录了机器人执行任务时的多模态数据。该数据集包含71个完整的情节，总计34336帧，以30帧每秒的速率捕捉了机器人关节位置、前视与侧视图像等信息。数据以分块形式存储于Parquet文件中，每块约1000帧，确保了高效的数据管理与读取。视频数据采用AV1编码，分辨率统一为640x480，为机器人行为分析提供了丰富的视觉上下文。

特点

take69数据集的特点在于其多维度的观测空间与精细的时间同步。数据集不仅提供了六自由度机械臂的关节位置作为动作与状态观测，还同步记录了双视角的RGB视频流，形成了状态-动作-视觉的完整数据链。每个数据点均附有精确的时间戳、帧索引与情节索引，支持时序分析与跨情节研究。数据格式采用标准化特征描述，便于直接应用于强化学习或模仿学习算法。数据集规模适中，兼顾了计算效率与信息密度，适合用于机器人控制策略的验证与迁移。

使用方法

使用take69数据集时，研究者可通过LeRobot提供的工具链直接加载数据。数据集已按训练集划分，涵盖全部71个情节，用户可依据帧索引或情节索引提取特定片段。对于机器人控制任务，可联合利用关节位置数据与视频观测，训练端到端的策略模型。数据集的Parquet格式支持流式读取，适合大规模训练流程；视频文件则可单独解码，用于视觉表征学习。在应用过程中，建议注意数据的时间连续性，利用时间戳字段构建序列模型，以捕捉机器人行为的动态特性。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的发展亟需高质量、多模态的真实世界交互数据集作为支撑。Take69数据集由HuggingFace的LeRobot项目创建，专注于机器人操作任务的数据收集。该数据集采用so_follower型机器人，记录了71个完整交互片段，涵盖34336帧多视角视觉观测与六自由度关节动作数据，旨在为机器人策略学习提供端到端的训练资源。其结构化设计融合了状态、图像与时间序列信息，体现了当前机器人数据集向规模化、标准化演进的重要趋势，为泛化性策略的构建奠定了数据基础。

当前挑战

Take69数据集致力于解决机器人模仿学习中从多模态感知到连续动作映射的复杂挑战，其核心在于如何从高维视觉输入中提取有效特征并生成精确、稳定的关节控制指令。在构建过程中，数据集面临多传感器时序同步、大规模视频数据的高效压缩与存储，以及真实物理环境中动作示范的噪声与偏差控制等实际问题。此外，有限的交互任务种类与样本规模可能制约学习模型的泛化能力，如何扩展任务多样性并保证数据质量成为持续优化的关键。

常用场景

经典使用场景

在机器人学领域，take69数据集以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集记录了机械臂执行任务过程中的关节状态、视觉观察与动作序列，特别适用于训练端到端的机器人控制策略。研究者能够利用其包含的前视与侧视视频流，结合六自由度关节位置信息，构建从感知到动作的映射模型，从而在仿真或真实环境中实现精细的操作任务复现。

实际应用

在实际机器人部署中，take69数据集能够指导服务型或工业机械臂完成物体抓取、放置等日常操作。基于该数据训练的模型可迁移至类似构型的机器人平台，实现无需复杂编程的自主任务执行。在智能仓储、家庭辅助等场景，此类数据驱动的控制方法能降低机器人编程门槛，提升系统适应动态环境的能力，为柔性自动化提供技术支撑。

衍生相关工作

围绕take69数据集，衍生出一系列专注于机器人视觉运动控制的研究。例如，基于其多视角视频序列的工作探索了时空注意力机制在动作预测中的应用；另有研究利用其状态-动作对训练逆动力学模型，提升策略的精确性。这些工作通常整合至LeRobot等开源生态，进一步推动了模仿学习与行为克隆算法在真实机器人系统中的标准化与普及。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集