five

behavior1k-task0018

收藏
Hugging Face2025-11-15 更新2025-11-16 收录
下载链接:
https://huggingface.co/datasets/fracapuano/behavior1k-task0018
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由LeRobot创建的机器人数据集,包含200个集段,总帧数为2207489。数据集包含RGB、深度、分割等多种类型的观察数据,以及动作、时间戳等特征。数据集适用于机器人领域的研究和应用。
创建时间:
2025-11-11
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot
  • 创建工具: LeRobot

数据集规模

  • 总任务数: 1
  • 总片段数: 200
  • 总帧数: 2,207,489
  • 总视频数: 1,800
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB

技术规格

  • 帧率: 30 FPS
  • 代码库版本: v3.0
  • 机器人类型: R1Pro
  • 数据分块大小: 10,000

数据特征

图像观测数据

  • 左腕RGB图像: 480×480×3
  • 右腕RGB图像: 480×480×3
  • 头部RGB图像: 720×720×3
  • 左腕深度图像: 480×480×3
  • 右腕深度图像: 480×480×3
  • 头部深度图像: 720×720×3
  • 左腕实例分割图像: 480×480×3
  • 右腕实例分割图像: 480×480×3
  • 头部实例分割图像: 720×720×3

其他数据特征

  • 动作数据: 23维浮点数组
  • 时间戳: 1维浮点数组
  • 片段索引: 1维整型数组
  • 帧索引: 1维整型数组
  • 相机相对位姿: 21维浮点数组
  • 状态观测: 256维浮点数组
  • 任务索引: 1维整型数组

数据组织

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 元信息路径: meta/episodes/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
  • 标注路径: annotations/task-{episode_chunk:04d}/episode_{episode_index:08d}.json

数据划分

  • 训练集: 0:10000
搜集汇总
数据集介绍
构建方式
在机器人技术领域,数据集的构建质量直接影响模型性能。behavior1k-task0018采用R1Pro机器人平台,通过LeRobot框架系统采集多模态数据。该数据集包含200个完整任务片段,总计220余万帧数据,以30帧/秒的速率记录。数据以分块形式存储,每块包含10000个样本,采用parquet格式高效压缩。同步采集的视觉数据包括左右腕部和头部视角的RGB图像、深度图及实例分割图,分辨率分别为480×480和720×720,并配套记录23维动作向量与256维状态向量。
使用方法
针对机器人行为克隆研究,该数据集提供标准化的加载流程。通过meta/info.json配置文件可获取数据集的完整元信息,包括分块策略和特征描述。数据读取遵循{chunk_index:03d}和{file_index:03d}的命名规范,支持按需加载特定任务片段。训练集划分明确标注为前10000个样本,研究者可结合视频路径模板提取对应MP4文件。多模态数据可通过特征键直接访问,如observation.images.rgb.left_wrist获取左腕RGB流,action字段提取控制指令,timestamp确保时序一致性,为端到端行为学习提供完整数据支撑。
背景与挑战
背景概述
机器人学习领域近年来致力于开发能够执行复杂任务的智能体,behavior1k-task0018数据集作为LeRobot项目的重要组成部分,聚焦于多模态行为数据的采集与分析。该数据集通过R1Pro机器人平台记录包含200个任务片段的高维观测数据,涵盖手腕与头部视角的RGB图像、深度信息及实例分割数据,为研究机器人动作规划与环境交互提供了丰富的时空特征基础。其构建遵循Apache 2.0开源协议,采用分块存储与并行处理架构,显著提升了大规模机器人行为数据的可访问性与计算效率。
当前挑战
该数据集旨在解决机器人行为模仿学习中的动作序列建模难题,其核心挑战在于如何从异构传感器数据中提取有效的时空表征以指导机器人动作生成。构建过程中面临多源传感器同步校准的技术瓶颈,需确保不同视角的视觉数据与23维动作向量的时序一致性。数据规模带来的存储压力亦不容忽视,220万帧视频数据需通过分块压缩技术平衡质量与效率,而实例分割标注的精度直接影响行为语义理解的可靠性。
常用场景
经典使用场景
在机器人学习领域,behavior1k-task0018数据集通过多视角视觉感知与动作序列的同步记录,为模仿学习算法提供了丰富的训练素材。该数据集以30Hz频率采集的RGB图像、深度信息和实例分割数据,配合23维动作向量,构建了完整的机器人行为演示链条,特别适用于端到端策略网络的训练与验证。
解决学术问题
该数据集有效解决了机器人技能迁移中的动作表示学习难题,通过高精度时间戳对齐的多模态观测数据,为研究连续动作空间中的策略泛化提供了基准。其结构化存储的轨迹数据显著降低了真实世界机器人实验的成本,推动了对复杂任务中状态-动作映射关系的基础理论研究。
实际应用
基于R1Pro机器人平台采集的实景操作数据,该数据集可直接应用于工业分拣、精密装配等场景的自动化流程优化。其包含的腕部与头部多视角视觉系统,为开发适应动态环境的抓取策略提供了关键训练数据,显著提升了机器人对非结构化场景的适应能力。
数据集最近研究
最新研究方向
在机器人学习领域,behavior1k-task0018数据集凭借其多模态感知数据与精细动作标注,正推动模仿学习与具身智能的前沿探索。该数据集通过R1Pro机器人采集的头部及双腕视觉信息,结合深度感知与实例分割数据,为三维场景理解与灵巧操作研究提供了丰富素材。当前研究聚焦于跨模态表征学习,将视觉观测与23维动作空间映射关联,旨在提升机器人对复杂任务的泛化能力。随着开源社区LeRobot的持续优化,此类数据集正成为推动机器人从预设任务向自主决策转型的关键基石,为家庭服务与工业自动化等场景的智能系统开发奠定数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作