behavior1k-task0017
收藏Hugging Face2025-11-15 更新2025-11-16 收录
下载链接:
https://huggingface.co/datasets/fracapuano/behavior1k-task0017
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,包含了200个总剧集和1个总任务,共有1887709帧数据。数据集的结构包括机器人类型、每集的帧数、任务数等信息,并且详细描述了不同类型数据的文件路径,如视频、注释和元数据。数据集中的特征包括不同类型的观察(例如, RGB图像、深度图像、分割实例ID)和动作。但是,README文件中没有提供数据集的详细中文描述。
创建时间:
2025-11-11
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
数据集结构
统计信息
- 总任务数: 1
- 总片段数: 200
- 总帧数: 1,887,709
- 总视频数: 1,800
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
- 帧率: 30 FPS
- 代码库版本: v3.0
- 机器人类型: R1Pro
数据组织
- 数据文件格式: Parquet
- 分块大小: 10,000
- 训练集划分: 0:10000
特征字段
图像观测数据
- 左腕RGB图像: 480×480×3,视频格式,30 FPS
- 右腕RGB图像: 480×480×3,视频格式,30 FPS
- 头部RGB图像: 720×720×3,视频格式,30 FPS
- 左腕深度图像: 480×480×3,深度图,视频格式,30 FPS
- 右腕深度图像: 480×480×3,深度图,视频格式,30 FPS
- 头部深度图像: 720×720×3,深度图,视频格式,30 FPS
- 左腕实例分割图像: 480×480×3,视频格式,30 FPS
- 右腕实例分割图像: 480×480×3,视频格式,30 FPS
- 头部实例分割图像: 720×720×3,视频格式,30 FPS
其他数据
- 动作: float32[23],30 FPS
- 时间戳: float32[1],30 FPS
- 片段索引: int64[1],30 FPS
- 帧索引: int64[1],30 FPS
- 任务索引: int64[1],30 FPS
- 相机相对位姿: float32[21],30 FPS
- 状态观测: float32[256],30 FPS
文件路径模式
- 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 元信息文件: meta/episodes/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
- 标注文件: annotations/task-{episode_chunk:04d}/episode_{episode_index:08d}.json
缺失信息
- 主页: 待补充
- 论文: 待补充
- 引用格式: 待补充
搜集汇总
数据集介绍
构建方式
在机器人技术领域,高质量数据集的构建对算法训练至关重要。behavior1k-task0017数据集依托LeRobot平台,采用R1Pro机器人采集多模态数据,涵盖200个完整任务片段,总计188万余帧。数据以分块形式存储,每块包含10000帧,以30帧/秒的速率记录。原始数据通过Parquet格式组织,并辅以视频流与元数据文件,确保数据结构的完整性与可追溯性。
特点
该数据集在机器人感知研究中展现出显著的多源异构特性。其核心特征在于同步采集了头部与双腕的RGB图像、深度信息及实例分割数据,分辨率分别为720×720与480×480。动作空间以23维浮点向量表征,同时整合了相机相对位姿、256维状态向量等高维观测信号。数据标注体系涵盖时间戳、任务索引等多维度元数据,为复杂任务下的行为分析提供丰富上下文。
使用方法
针对机器人行为克隆研究,该数据集支持端到端的训练流程。研究者可通过解析Parquet文件获取观测-动作对序列,利用视频路径字段调用对应视觉数据。训练集划分明确指向前10000个数据块,元数据与标注文件分别存储于meta/episodes与annotations目录。数据加载时需注意不同传感器数据的帧率同步,深度图采用yuv420p16le像素格式存储,需专用解码器处理。
背景与挑战
背景概述
在机器人技术迅猛发展的背景下,行为数据集成为推动智能体与环境交互能力提升的关键资源。behavior1k-task0017数据集由HuggingFace的LeRobot项目团队构建,依托R1Pro机器人平台采集多模态感知数据,涵盖200个任务片段与近190万帧观测记录。该数据集通过整合头部与腕部视角的RGB图像、深度信息及实例分割数据,旨在解决机器人操作任务中的感知建模与动作规划问题,为模仿学习与强化学习算法提供标准化基准。
当前挑战
机器人操作任务面临环境感知维度高与动作序列长期依赖的复杂性挑战,需从多视角视觉输入中提取鲁棒特征并生成精确控制指令。数据集构建过程中,同步采集六路高清视频流与23维动作向量对存储与计算资源提出极高要求;多传感器时序对齐、深度数据压缩编码以及大规模视频文件的分布式存储架构设计,均成为技术实现的核心难点。
常用场景
经典使用场景
在机器人行为学习领域,该数据集通过R1Pro机器人采集的多视角视觉与动作序列数据,为模仿学习算法提供了丰富的训练素材。其包含的200个任务片段与188万帧数据,能够有效支撑机器人从观察中学习复杂操作技能的研究工作,尤其在多模态感知与动作映射方面具有重要价值。
解决学术问题
该数据集主要解决了机器人学习中的动作表示与状态感知耦合问题。通过提供同步采集的RGB图像、深度信息与实例分割数据,研究者能够深入探索视觉表征与动作序列的对应关系,为端到端的行为克隆与强化学习算法开发奠定数据基础,显著推进了具身智能系统的环境交互能力研究。
衍生相关工作
该数据集催生了基于Transformer的多模态行为预测架构研究,诸多工作利用其丰富的时空特征开发了分层动作规划算法。相关研究进一步拓展到跨任务技能迁移领域,衍生出基于元学习的快速适应方法,为机器人持续学习范式提供了重要基准测试平台。
以上内容由遇见数据集搜集并总结生成



