behavior1k-task0033
收藏Hugging Face2025-11-15 更新2025-11-16 收录
下载链接:
https://huggingface.co/datasets/fracapuano/behavior1k-task0033
下载链接
链接失效反馈官方服务:
资源简介:
这是一个由LeRobot创建的机器人任务数据集,包含200个剧集,每个剧集包含左手腕、右手腕和头部的RGB图像、深度图像和实例分割图像,以及相应的动作和状态信息。数据集总共包含2244560帧,使用Apache-2.0许可证。
This is a robotic task dataset created by LeRobot, consisting of 200 episodes. Each episode contains RGB images, depth images and instance segmentation images collected from the left wrist, right wrist and head, as well as corresponding action and state information. The dataset includes a total of 2,244,560 frames and is licensed under the Apache-2.0 license.
创建时间:
2025-11-11
原始信息汇总
数据集概述
基本信息
- 数据集名称: behavior1k-task0033
- 任务类别: 机器人技术
- 标签: LeRobot
- 许可证: Apache-2.0
- 创建工具: LeRobot
数据集规模
- 总任务数: 1
- 总情节数: 200
- 总帧数: 2,244,560
- 总视频数: 1,800
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
技术规格
- 帧率: 30 FPS
- 块大小: 10,000
- 代码库版本: v3.0
- 机器人类型: R1Pro
数据特征
图像观察数据
- 左腕RGB图像: 480×480×3,H.265编码
- 右腕RGB图像: 480×480×3,H.265编码
- 头部RGB图像: 720×720×3,H.265编码
- 左腕深度图像: 480×480×3,16位深度图
- 右腕深度图像: 480×480×3,16位深度图
- 头部深度图像: 720×720×3,16位深度图
- 左腕实例分割: 480×480×3
- 右腕实例分割: 480×480×3
- 头部实例分割: 720×720×3
其他数据
- 动作: 23维浮点向量
- 时间戳: 单精度浮点
- 相机相对位姿: 21维浮点向量
- 状态观察: 256维浮点向量
- 索引数据: 情节索引、帧索引、任务索引
数据分割
- 训练集: 0-10000
文件结构
- 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 元信息文件: meta/episodes/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
- 标注文件: annotations/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
引用信息
- 主页: 信息缺失
- 论文: 信息缺失
- BibTeX引用: 信息缺失
搜集汇总
数据集介绍

构建方式
在机器人技术领域,数据集的构建方式直接影响其科研价值。behavior1k-task0033数据集依托LeRobot平台,采用R1Pro型机器人采集多模态数据,涵盖200个完整任务片段,总计2244560帧图像。数据以分块形式存储,每块包含10000帧,采样频率为30赫兹,通过标准化流程记录机器人动作与环境交互信息,确保数据的时序一致性与完整性。
特点
该数据集在机器人感知研究领域展现出显著特点,其核心优势在于多视角视觉数据的全面覆盖。数据集提供头部及双腕部的高清RGB图像(分辨率分别为720×720和480×480),同步配备深度图与实例分割标注,形成三维视觉感知体系。动作空间包含23维连续控制指令,结合256维状态观测向量,为模仿学习与策略优化提供丰富特征。数据规模达到1.8TB,涵盖1800段视频流,满足复杂任务训练的存储需求。
使用方法
针对机器人学习任务的应用场景,该数据集支持端到端的训练流程。研究者可通过解析parquet格式的数据文件获取观测-动作对序列,利用视频路径索引调用对应视觉数据。训练集划分明确指向前10000个数据块,元数据文件详细记录任务参数与传感器标定信息。深度图采用yuv420p16le编码格式,需专用解码器还原真实物理尺度,而动作数据可直接用于控制策略的监督训练。
背景与挑战
背景概述
在机器人技术迅猛发展的时代背景下,行为数据集成为推动机器人智能决策与自主操作能力提升的关键资源。behavior1k-task0033数据集由HuggingFace的LeRobot项目团队构建,采用R1Pro型机器人采集多模态感知数据,包含200个任务片段与224万帧高精度观测记录。该数据集聚焦于机器人操作任务的时序行为建模,通过头戴式与腕部摄像头同步采集RGB图像、深度信息及实例分割数据,为机器人模仿学习与强化学习算法提供了丰富的训练素材,显著促进了机器人对复杂环境的感知与交互能力发展。
当前挑战
该数据集致力于解决机器人操作任务中的多模态感知与动作序列建模难题,其核心挑战在于异构传感器数据的时空对齐与跨模态融合。构建过程中面临多重技术瓶颈:多视角视觉数据(头戴/双腕摄像头)的标定与同步采集需要精密的时间戳管理;深度图像与实例分割标注的生成需克服实时处理算力限制;23维连续动作空间的精确记录对机器人控制系统的稳定性提出极高要求。此外,大规模视频数据的压缩存储与高效检索亦构成工程实现层面的重要挑战。
常用场景
经典使用场景
在机器人学习领域,behavior1k-task0033数据集通过多视角视觉数据与动作序列的精确同步,为模仿学习算法提供了丰富的训练素材。该数据集包含来自头戴式及腕部摄像头的RGB图像、深度信息和实例分割数据,配合23维动作向量,能够有效支撑端到端策略网络的训练过程,特别适用于复杂操作任务的动态建模。
解决学术问题
该数据集显著缓解了机器人模仿学习中多模态感知与运动控制联合建模的挑战。通过提供高帧率多视角视觉流与精确动作标注,解决了传统方法在时空对齐与状态表征方面的局限性。其丰富的传感器模态为研究跨模态表征学习、动作预测模型提供了基准数据,推动了具身智能在动态环境中的适应性研究。
衍生相关工作
该数据集作为LeRobot生态的重要组成部分,已催生多项基于行为克隆的机器人控制研究。相关成果包括多传感器融合的端到端策略网络、基于时空注意力的动作预测模型,以及结合深度强化学习的自适应控制框架,这些工作持续推动着开源机器人学习社区的技术演进。
以上内容由遇见数据集搜集并总结生成



