behavior1k-task0018

Hugging Face2025-11-15 更新2025-11-16 收录

下载链接：

https://huggingface.co/datasets/fracapuano/behavior1k-task0018

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个由LeRobot创建的机器人数据集，包含200个集段，总帧数为2207489。数据集包含RGB、深度、分割等多种类型的观察数据，以及动作、时间戳等特征。数据集适用于机器人领域的研究和应用。

创建时间：

2025-11-11

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot
创建工具: LeRobot

数据集规模

总任务数: 1
总片段数: 200
总帧数: 2,207,489
总视频数: 1,800
数据文件大小: 100 MB
视频文件大小: 500 MB

技术规格

帧率: 30 FPS
代码库版本: v3.0
机器人类型: R1Pro
数据分块大小: 10,000

数据特征

图像观测数据

左腕RGB图像: 480×480×3
右腕RGB图像: 480×480×3
头部RGB图像: 720×720×3
左腕深度图像: 480×480×3
右腕深度图像: 480×480×3
头部深度图像: 720×720×3
左腕实例分割图像: 480×480×3
右腕实例分割图像: 480×480×3
头部实例分割图像: 720×720×3

其他数据特征

动作数据: 23维浮点数组
时间戳: 1维浮点数组
片段索引: 1维整型数组
帧索引: 1维整型数组
相机相对位姿: 21维浮点数组
状态观测: 256维浮点数组
任务索引: 1维整型数组

数据组织

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
元信息路径: meta/episodes/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
标注路径: annotations/task-{episode_chunk:04d}/episode_{episode_index:08d}.json

数据划分

训练集: 0:10000

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的构建质量直接影响模型性能。behavior1k-task0018采用R1Pro机器人平台，通过LeRobot框架系统采集多模态数据。该数据集包含200个完整任务片段，总计220余万帧数据，以30帧/秒的速率记录。数据以分块形式存储，每块包含10000个样本，采用parquet格式高效压缩。同步采集的视觉数据包括左右腕部和头部视角的RGB图像、深度图及实例分割图，分辨率分别为480×480和720×720，并配套记录23维动作向量与256维状态向量。

使用方法

针对机器人行为克隆研究，该数据集提供标准化的加载流程。通过meta/info.json配置文件可获取数据集的完整元信息，包括分块策略和特征描述。数据读取遵循{chunk_index:03d}和{file_index:03d}的命名规范，支持按需加载特定任务片段。训练集划分明确标注为前10000个样本，研究者可结合视频路径模板提取对应MP4文件。多模态数据可通过特征键直接访问，如observation.images.rgb.left_wrist获取左腕RGB流，action字段提取控制指令，timestamp确保时序一致性，为端到端行为学习提供完整数据支撑。

背景与挑战

背景概述

机器人学习领域近年来致力于开发能够执行复杂任务的智能体，behavior1k-task0018数据集作为LeRobot项目的重要组成部分，聚焦于多模态行为数据的采集与分析。该数据集通过R1Pro机器人平台记录包含200个任务片段的高维观测数据，涵盖手腕与头部视角的RGB图像、深度信息及实例分割数据，为研究机器人动作规划与环境交互提供了丰富的时空特征基础。其构建遵循Apache 2.0开源协议，采用分块存储与并行处理架构，显著提升了大规模机器人行为数据的可访问性与计算效率。

当前挑战

该数据集旨在解决机器人行为模仿学习中的动作序列建模难题，其核心挑战在于如何从异构传感器数据中提取有效的时空表征以指导机器人动作生成。构建过程中面临多源传感器同步校准的技术瓶颈，需确保不同视角的视觉数据与23维动作向量的时序一致性。数据规模带来的存储压力亦不容忽视，220万帧视频数据需通过分块压缩技术平衡质量与效率，而实例分割标注的精度直接影响行为语义理解的可靠性。

常用场景

经典使用场景

在机器人学习领域，behavior1k-task0018数据集通过多视角视觉感知与动作序列的同步记录，为模仿学习算法提供了丰富的训练素材。该数据集以30Hz频率采集的RGB图像、深度信息和实例分割数据，配合23维动作向量，构建了完整的机器人行为演示链条，特别适用于端到端策略网络的训练与验证。

解决学术问题

该数据集有效解决了机器人技能迁移中的动作表示学习难题，通过高精度时间戳对齐的多模态观测数据，为研究连续动作空间中的策略泛化提供了基准。其结构化存储的轨迹数据显著降低了真实世界机器人实验的成本，推动了对复杂任务中状态-动作映射关系的基础理论研究。

实际应用

基于R1Pro机器人平台采集的实景操作数据，该数据集可直接应用于工业分拣、精密装配等场景的自动化流程优化。其包含的腕部与头部多视角视觉系统，为开发适应动态环境的抓取策略提供了关键训练数据，显著提升了机器人对非结构化场景的适应能力。

数据集最近研究