agibot_alpha_v30

Hugging Face2025-05-15 更新2025-05-16 收录

下载链接：

https://huggingface.co/datasets/cadene/agibot_alpha_v30

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人（LeRobot）操作的数据集，包含了28122个剧集和47613574帧数据，共有30个任务。数据集以Apache-2.0许可证发布。数据集的结构中包含了丰富的特征信息，包括机器人的关节位置、头和夹爪的位置和方向、腰部位置等。此外，还包含了行动的描述和视频数据，适用于机器人操作的研究和学习。

创建时间：

2025-05-11

原始信息汇总

数据集概述

基本信息

名称: agibot_alpha_v30
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
代码库版本: v3.0
机器人类型: AgiBot_A2D

数据集结构

总情节数: 28,122
总帧数: 47,613,574
总任务数: 30
分块大小: 1,000
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
分割:
- 训练集: 0-28,122

数据文件路径

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征描述

观察特征

状态观察:
- 效应器位置: 2维浮点数组 (左、右夹持器)
- 末端位置: 6维浮点数组 (左、右x/y/z)
- 末端方向: 8维浮点数组 (左、右x/y/z/w)
- 头部位置: 2维浮点数组 (偏航、俯仰)
- 关节电流值: 14维浮点数组 (左、右关节0-6)
- 关节位置: 14维浮点数组 (左、右关节0-6)
- 腰部位置: 2维浮点数组 (俯仰、升降)
- 综合状态: 20维浮点数组 (头部、关节、夹持器、腰部状态)

动作特征

效应器位置: 2维浮点数组
末端位置: 6维浮点数组
末端方向: 8维浮点数组
头部位置: 2维浮点数组
关节位置: 14维浮点数组
机器人速度: 2维浮点数组 (x速度、偏航率)
腰部位置: 2维浮点数组
综合动作: 22维浮点数组 (头部、关节、夹持器、腰部、速度)

其他特征

文本信息:
- 初始场景文本: 字符串
- 动作文本: 字符串
- 技能: 字符串
时间信息:
- 时间戳: 浮点数
- 帧索引: 整数
- 情节索引: 整数
- 索引: 整数
- 任务索引: 整数

图像观察

图像特征:
- 顶部头部图像: 480x640x3 (视频格式)
- 左手图像: 480x640x3
- 右手图像: 480x640x3
- 头部中央鱼眼图像: 748x960x3
- 头部左侧鱼眼图像: 748x960x3
- 头部右侧鱼眼图像: 748x960x3
- 后部左侧鱼眼图像: 748x960x3
- 后部右侧鱼眼图像: 748x960x3

引用信息

BibTeX: [缺失]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，agibot_alpha_v30数据集依托LeRobot框架精心构建，采用AgiBot_A2D双手机器人平台采集数据。该数据集囊括28122个完整交互序列，总计4760万帧数据，涵盖30种任务场景。数据以分块形式存储于Parquet文件中，每块包含1000个数据单元，辅以多视角视频记录，帧率稳定在30fps，确保时序连贯性。

特点

该数据集展现出多维感知融合的显著特征，集成七路视觉传感器数据，包括顶部视角、左右手部视角及多路鱼眼镜头，分辨率涵盖480×640至748×960像素。状态观测向量涵盖20维机器人本体信息，动作空间则扩展至22维控制指令，完整覆盖关节位置、末端位姿、夹持器状态及移动基座参数。文本标注维度包含初始场景描述与动作指令，为多模态学习提供丰富语义支撑。

使用方法

研究人员可通过标准数据加载接口访问该数据集，按照既定路径模式读取分块存储的Parquet文件。训练集完整包含全部28122个交互序列，支持直接从视频路径提取多视角视觉流。数据字段严格遵循命名规范，观测状态与动作空间维度明确，便于构建端到端的机器人控制模型。各传感器数据时空对齐精确，可直接用于模仿学习、强化学习等算法验证。

背景与挑战

背景概述

在机器人技术迅猛发展的背景下，agibot_alpha_v30数据集作为HuggingFace平台LeRobot项目的重要组成部分应运而生。该数据集依托AgiBot_A2D双手机器人平台，通过28122个任务片段和4760万帧数据，系统记录了多模态传感器信息与机器人动作指令的时空关联。其核心价值在于构建了从视觉感知到关节控制的完整闭环数据流，为具身智能研究提供了涵盖30种任务的标准化基准。数据集采用Apache 2.0开源协议，通过结构化存储的parquet格式与视频文件，实现了机器人操作数据的规模化采集与高效访问。

当前挑战

该数据集面临的领域挑战主要体现为双手机器人精细操作的时空协调难题，需在动态环境中同步处理14个关节自由度与多视角视觉反馈的复杂映射关系。构建过程中存在多源传感器数据对齐的技术瓶颈，包括7路高清视频流与38维状态动作向量的时序同步，以及海量数据存储优化问题——原始视频数据达500GB而特征数据仅100MB，需平衡存储效率与读取性能。此外，跨模态数据的语义标注一致性保障，特别是动作文本与实体操作的精确对应，仍是亟待突破的关键技术难点。

常用场景

经典使用场景

在机器人学习领域，agibot_alpha_v30数据集凭借其丰富的双机械臂操作数据，成为模仿学习算法的理想测试平台。该数据集记录了AgiBot_A2D机器人执行30种任务时的完整状态观测与动作序列，涵盖末端执行器位姿、关节角度及多视角视觉信息，为研究机器人复杂操作行为的生成与泛化提供了标准化实验环境。

实际应用

基于该数据集训练的模型已应用于工业分拣、精密装配等场景，其双机械臂协同操作数据特别适合开发柔性制造系统中的自适应抓取算法。在服务机器人领域，这些包含头部视觉与手眼协调的数据为开发智能助老机器人提供了关键的技术验证基础，推动了机器人从结构化场景向开放环境的过渡。

衍生相关工作

该数据集催生了多项里程碑式研究，包括基于Transformer的多任务策略网络架构和跨模态表示学习方法。在LeRobot生态系统中，研究者利用其构建了分层强化学习框架，实现了从原始传感器数据到复杂操作技能的端到端学习，这些成果持续推动着机器人开源社区在行为克隆与元学习方向的创新突破。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集