orangeV5

Hugging Face2025-10-29 更新2025-10-30 收录

下载链接：

https://huggingface.co/datasets/DrainpipeAI/orangeV5

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人学相关的数据集，特别是与类型为 'so101_follower' 的机器人相关。数据以 Parquet 文件格式存储，包含机器人的关节位置和来自两个不同摄像头视角的图像等多种特征。数据集仅包含训练数据，具体包括总剧集数、总帧数和任务数。同时，数据集还包含了关于视频文件、格式和大小的元数据。不过，关于数据集的来源、用途和使用方法的详细信息并未提供，因为包含有 '更多信息需要' 这样的占位符。

创建时间：

2025-10-28

原始信息汇总

orangeV5数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot

数据集规模

总任务数: 1
总回合数: 54
总帧数: 17908
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB

数据结构

数据组织

数据文件格式: Parquet
分块大小: 1000
数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
训练集划分: 全部54个回合

特征字段

动作特征

数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
维度: [6]
关节名称: 与动作特征相同

图像观测 正面图像

数据类型: 视频
分辨率: 720×1280×3
视频编码: AV1
像素格式: yuv420p
非深度图

侧面图像

数据类型: 视频
分辨率: 720×1280×3
视频编码: AV1
像素格式: yuv420p
非深度图

索引特征

时间戳: float32[1]
帧索引: int64[1]
回合索引: int64[1]
数据索引: int64[1]
任务索引: int64[1]

技术规格

代码库版本: v3.0
机器人类型: so101_follower
所有视频特征:
- 帧率: 30 FPS
- 无音频
- 3个颜色通道

搜集汇总

数据集介绍

构建方式

在机器人技术领域，orangeV5数据集依托LeRobot框架精心构建而成，通过采集54个完整交互片段，累计17908帧数据，以30帧每秒的速率记录机械臂的连续动作与状态变化。数据以分块存储形式组织，每个数据块包含1000帧信息，采用Parquet格式高效压缩存储，同时配套保存多视角高清视频流，确保原始交互场景的完整复现。

特点

该数据集在机器人操作任务中展现出多维度的数据特性，不仅涵盖6自由度机械臂的关节位置控制指令与实时状态反馈，还集成双路视觉观测通道，分别从前视与侧视角度捕捉720p分辨率的环境图像。时序信息通过精确的时间戳与帧索引对齐，支持对长程动作序列的细粒度分析，为模仿学习与策略优化研究提供丰富的数据支撑。

使用方法

研究者可通过解析Parquet数据文件获取结构化观测与动作序列，结合配套视频流实现多模态数据同步分析。数据集已预划分为训练集，支持直接加载用于行为克隆或强化学习算法训练。利用帧索引与时间戳可实现跨模态数据的精准对齐，而分块存储机制则便于大数据量下的流式读取与分布式处理。

背景与挑战

背景概述

机器人技术领域正经历从结构化环境向非结构化场景的演进，orangeV5数据集作为LeRobot项目的重要组成部分，聚焦于多模态机器人操作任务的实证研究。该数据集通过集成六自由度机械臂关节控制信号与双视角视觉感知数据，构建了包含54个完整任务序列的机器人交互轨迹库，其数据采集频率达到30Hz，覆盖了机械臂运动学状态与高分辨率视觉观测的时空对齐。这类数据集对机器人模仿学习与策略泛化研究具有重要价值，为构建具身智能系统提供了真实世界交互范本。

当前挑战

在机器人操作任务领域，orangeV5需解决高维连续动作空间与多模态感知融合的复杂性挑战，具体体现在六关节协同控制的运动规划精度与双视角视觉特征的对齐一致性。数据集构建过程中面临传感器同步校准的技术难点，包括机械臂编码器数据与双路视觉流的时间戳精确匹配，以及大规模视频数据压缩存储与快速检索的工程挑战。此外，有限的任务场景覆盖度与样本多样性不足，也制约了学习模型的跨任务泛化能力。

常用场景

经典使用场景

在机器人学习领域，orangeV5数据集以其多模态观测与动作记录特性，成为模仿学习算法的经典验证平台。该数据集通过同步采集机械臂关节状态与双视角视觉数据，为研究者构建从感知到控制的端到端策略模型提供了完整实验环境。其结构化动作空间与高帧率视频流使得算法能够精准学习人类演示中的运动模式，特别适用于复杂操作任务的轨迹生成研究。

衍生相关工作

该数据集催生了系列机器人学习领域的创新研究，包括基于时空注意力的多视角视频预测模型、关节空间与任务空间混合的模仿学习框架等。其标准化的数据格式促进了LeRobot生态系统中算法模块的互操作性，衍生出的基准测试方法已被多个开源机器人项目采纳，推动了跨平台技能迁移研究的标准化进程。

数据集最近研究