five

orangeV5

收藏
Hugging Face2025-10-29 更新2025-10-30 收录
下载链接:
https://huggingface.co/datasets/DrainpipeAI/orangeV5
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个与机器人学相关的数据集,特别是与类型为 'so101_follower' 的机器人相关。数据以 Parquet 文件格式存储,包含机器人的关节位置和来自两个不同摄像头视角的图像等多种特征。数据集仅包含训练数据,具体包括总剧集数、总帧数和任务数。同时,数据集还包含了关于视频文件、格式和大小的元数据。不过,关于数据集的来源、用途和使用方法的详细信息并未提供,因为包含有 '更多信息需要' 这样的占位符。
创建时间:
2025-10-28
原始信息汇总

orangeV5数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集规模

  • 总任务数: 1
  • 总回合数: 54
  • 总帧数: 17908
  • 帧率: 30 FPS
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB

数据结构

数据组织

  • 数据文件格式: Parquet
  • 分块大小: 1000
  • 数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 训练集划分: 全部54个回合

特征字段

动作特征

  • 数据类型: float32
  • 维度: [6]
  • 关节名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测特征

状态观测

  • 数据类型: float32
  • 维度: [6]
  • 关节名称: 与动作特征相同

图像观测 正面图像

  • 数据类型: 视频
  • 分辨率: 720×1280×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

侧面图像

  • 数据类型: 视频
  • 分辨率: 720×1280×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

索引特征

  • 时间戳: float32[1]
  • 帧索引: int64[1]
  • 回合索引: int64[1]
  • 数据索引: int64[1]
  • 任务索引: int64[1]

技术规格

  • 代码库版本: v3.0
  • 机器人类型: so101_follower
  • 所有视频特征:
    • 帧率: 30 FPS
    • 无音频
    • 3个颜色通道
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,orangeV5数据集依托LeRobot框架精心构建而成,通过采集54个完整交互片段,累计17908帧数据,以30帧每秒的速率记录机械臂的连续动作与状态变化。数据以分块存储形式组织,每个数据块包含1000帧信息,采用Parquet格式高效压缩存储,同时配套保存多视角高清视频流,确保原始交互场景的完整复现。
特点
该数据集在机器人操作任务中展现出多维度的数据特性,不仅涵盖6自由度机械臂的关节位置控制指令与实时状态反馈,还集成双路视觉观测通道,分别从前视与侧视角度捕捉720p分辨率的环境图像。时序信息通过精确的时间戳与帧索引对齐,支持对长程动作序列的细粒度分析,为模仿学习与策略优化研究提供丰富的数据支撑。
使用方法
研究者可通过解析Parquet数据文件获取结构化观测与动作序列,结合配套视频流实现多模态数据同步分析。数据集已预划分为训练集,支持直接加载用于行为克隆或强化学习算法训练。利用帧索引与时间戳可实现跨模态数据的精准对齐,而分块存储机制则便于大数据量下的流式读取与分布式处理。
背景与挑战
背景概述
机器人技术领域正经历从结构化环境向非结构化场景的演进,orangeV5数据集作为LeRobot项目的重要组成部分,聚焦于多模态机器人操作任务的实证研究。该数据集通过集成六自由度机械臂关节控制信号与双视角视觉感知数据,构建了包含54个完整任务序列的机器人交互轨迹库,其数据采集频率达到30Hz,覆盖了机械臂运动学状态与高分辨率视觉观测的时空对齐。这类数据集对机器人模仿学习与策略泛化研究具有重要价值,为构建具身智能系统提供了真实世界交互范本。
当前挑战
在机器人操作任务领域,orangeV5需解决高维连续动作空间与多模态感知融合的复杂性挑战,具体体现在六关节协同控制的运动规划精度与双视角视觉特征的对齐一致性。数据集构建过程中面临传感器同步校准的技术难点,包括机械臂编码器数据与双路视觉流的时间戳精确匹配,以及大规模视频数据压缩存储与快速检索的工程挑战。此外,有限的任务场景覆盖度与样本多样性不足,也制约了学习模型的跨任务泛化能力。
常用场景
经典使用场景
在机器人学习领域,orangeV5数据集以其多模态观测与动作记录特性,成为模仿学习算法的经典验证平台。该数据集通过同步采集机械臂关节状态与双视角视觉数据,为研究者构建从感知到控制的端到端策略模型提供了完整实验环境。其结构化动作空间与高帧率视频流使得算法能够精准学习人类演示中的运动模式,特别适用于复杂操作任务的轨迹生成研究。
衍生相关工作
该数据集催生了系列机器人学习领域的创新研究,包括基于时空注意力的多视角视频预测模型、关节空间与任务空间混合的模仿学习框架等。其标准化的数据格式促进了LeRobot生态系统中算法模块的互操作性,衍生出的基准测试方法已被多个开源机器人项目采纳,推动了跨平台技能迁移研究的标准化进程。
数据集最近研究
最新研究方向
在机器人学习领域,orangeV5数据集凭借其多模态特性正成为模仿学习研究的重要载体。该数据集通过整合六自由度机械臂的关节控制信号与双视角视觉观测数据,为机器人行为克隆算法提供了丰富的时空关联信息。当前研究聚焦于如何利用其同步记录的动作序列与高清视频流,开发能够理解复杂场景语义的端到端策略网络。随着具身智能研究热潮的兴起,这类包含真实物理交互记录的数据集正推动着机器人从单一技能学习向跨任务泛化能力的发展,为构建适应非结构化环境的通用机器人系统奠定数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作