behavior1k-task0037

Hugging Face2025-11-15 更新2025-11-16 收录

下载链接：

https://huggingface.co/datasets/fracapuano/behavior1k-task0037

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个与机器人学相关的数据集，包含200个总剧集，超过1058409个总帧数，共1个任务。数据集提供了不同身体部位（左手腕、右手腕、头部）的RGB和深度图像，以及动作、时间戳和相机相对姿态等信息。数据以Parquet文件格式存储，视频为MP4格式。该数据集遵循Apache-2.0许可证。

创建时间：

2025-11-11

原始信息汇总

数据集概述

基本信息

数据集名称: behavior1k-task0037
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot

数据集规模

总任务数: 1
总情节数: 200
总帧数: 1,058,409
总视频数: 1,800
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
分块大小: 10,000

数据结构

代码库版本: v3.0
机器人类型: R1Pro
数据格式: Parquet
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
元信息路径: meta/episodes/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
标注路径: annotations/task-{episode_chunk:04d}/episode_{episode_index:08d}.json

数据特征

图像观测

左腕RGB图像: 480×480×3，视频格式，30 FPS
右腕RGB图像: 480×480×3，视频格式，30 FPS
头部RGB图像: 720×720×3，视频格式，30 FPS
左腕深度图像: 480×480×3，深度图，视频格式，30 FPS
右腕深度图像: 480×480×3，深度图，视频格式，30 FPS
头部深度图像: 720×720×3，深度图，视频格式，30 FPS
左腕实例分割: 480×480×3，视频格式，30 FPS
右腕实例分割: 480×480×3，视频格式，30 FPS
头部实例分割: 720×720×3，视频格式，30 FPS

其他特征

动作: float32[23]，30 FPS
时间戳: float32[1]，30 FPS
情节索引: int64[1]，30 FPS
帧索引: int64[1]，30 FPS
任务索引: int64[1]，30 FPS
相机相对位姿: float32[21]，30 FPS
状态观测: float32[256]，30 FPS

数据划分

训练集: 0:10000

引用信息

论文: 待补充
主页: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的构建往往依赖于真实环境中的交互记录。该数据集通过R1Pro型机器人采集了200个完整任务片段，总计1058409帧数据，以30帧每秒的速率捕捉多视角传感器信息。数据采用分块存储策略，每块包含10000个数据点，并以Parquet格式高效组织，确保了大规模机器人行为数据的完整性与可管理性。

特点

该数据集显著特点在于其多模态观测体系，同步收录了头部与双腕部位的RGB图像、深度图及实例分割信息，分辨率分别达到720×720与480×480。动作空间以23维浮点向量表征，辅以256维状态观测与21维相机位姿数据，共同构成了机器人任务执行的立体化信息网络。所有时序数据均严格对齐，为复杂行为分析提供了坚实基底。

使用方法

研究者可通过LeRobot框架调用标准化数据接口，依据分块索引机制加载特定任务片段。训练集划分明确覆盖前10000个数据块，支持直接读取视频流与结构化特征数据。利用元数据文件可快速定位 episode 级标注信息，适用于行为克隆、强化学习等算法验证，其模块化设计便于拓展至不同机器人学习场景。

背景与挑战

背景概述

在机器人技术迅猛发展的背景下，behavior1k-task0037数据集作为LeRobot项目的重要组成部分，聚焦于机器人行为学习领域。该数据集通过R1Pro机器人平台采集多模态感知数据，包含200个任务片段和超过百万帧的时序记录，旨在推动机器人从视觉感知到动作执行的端到端学习研究。其结构化存储方案与丰富的传感器数据为机器人模仿学习与策略优化提供了关键支撑，标志着机器人数据驱动研究进入新阶段。

当前挑战

该数据集致力于解决机器人多模态感知与动作协同的复杂问题，其核心挑战在于异构传感器数据的时空对齐与跨模态融合。构建过程中面临高维度视频流与动作序列的存储压力，需平衡数据精度与存储效率；同时多视角视觉数据（头部/腕部摄像头）的标定一致性、深度图与实例分割数据的精确标注，均为数据质量保障带来显著技术难度。

常用场景

经典使用场景

在机器人学习领域，behavior1k-task0037数据集通过多视角视觉数据与动作序列的同步记录，为模仿学习算法提供了丰富的训练素材。其经典应用体现在利用头戴式与腕部摄像头采集的RGB图像、深度信息及实例分割数据，结合23维动作向量构建端到端的行为克隆模型。这种多模态感知与运动控制的联合表征，能够有效模拟人类操作者在复杂环境中的决策过程，为机器人行为策略的泛化能力奠定基础。

实际应用

基于R1Pro机器人平台采集的实景操作数据，该数据集在工业自动化与家庭服务机器人领域展现出广泛适用性。其多视角视觉系统可支撑精密装配任务的运动规划，深度信息与实例分割数据则助力于复杂场景下的物体抓取与避障决策。这类数据驱动的解决方案能够显著提升机器人在非结构化环境中的适应能力，为智能制造与生活辅助场景提供可靠的技术支撑。

衍生相关工作

以LeRobot生态为核心，该数据集催生了系列机器人学习的重要研究。其标准化的数据格式与多模态特性促进了分层强化学习框架的发展，启发了基于时空注意力机制的行为预测模型。相关研究通过挖掘数据中隐含的任务结构信息，推动了元强化学习在机器人领域的应用，并为跨模态表征学习、终身学习等前沿方向提供了基准测试平台。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集