five

dataset_test

收藏
Hugging Face2025-11-19 更新2025-11-20 收录
下载链接:
https://huggingface.co/datasets/haduki33/dataset_test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人技术相关的数据集,包含50个剧集,共计29762帧,分为一个任务。数据集以Parquet格式存储,并配有对应的视频文件。数据集的特征包括机器人的动作和状态,以及前、右、左三个方向的视频图像。每个视频图像的分辨率为480x640,使用av1编码,没有音频信息。数据集的帧率为30fps,支持训练集的划分。
创建时间:
2025-11-14
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

数据统计

  • 总情节数: 50
  • 总帧数: 29762
  • 总任务数: 1
  • 帧率: 30 FPS
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB

数据划分

  • 训练集: 0-50

数据特征

动作特征

  • 数据类型: float32
  • 维度: 12
  • 关节位置:
    • 左肩平移
    • 左肩抬升
    • 左肘弯曲
    • 左腕弯曲
    • 左腕旋转
    • 左夹爪
    • 右肩平移
    • 右肩抬升
    • 右肘弯曲
    • 右腕弯曲
    • 右腕旋转
    • 右夹爪

观测状态

  • 数据类型: float32
  • 维度: 12
  • 关节位置(与动作特征相同)

图像观测

前视摄像头:

  • 分辨率: 480×640×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

右侧摄像头:

  • 分辨率: 480×640×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

左侧摄像头:

  • 分辨率: 480×640×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

元数据

  • 时间戳: float32 (1维)
  • 帧索引: int64 (1维)
  • 情节索引: int64 (1维)
  • 索引: int64 (1维)
  • 任务索引: int64 (1维)

文件路径格式

  • 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

技术规格

  • 代码库版本: v3.0
  • 机器人类型: bi_so101_follower
  • 所有视频均无音频
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,dataset_test数据集依托LeRobot开源框架构建,采用Apache-2.0开源协议。该数据集通过双臂SO101型机器人采集了50个完整任务片段,共计29762帧数据,以1000帧为单元进行分块存储。数据以Parquet格式组织,包含动作指令、关节状态观测及多视角视觉数据,采样频率稳定维持在30Hz,所有训练片段被整合为单一训练集。
特点
该数据集的核心价值在于其多维异构数据融合特性,不仅完整记录12维双机械臂关节空间的动作与状态向量,更同步采集前视、左视、右视三路RGB视频流。所有视觉数据以AV1编码的MP4格式存储,分辨率统一为640×480像素,帧率与动作数据严格对齐。数据集通过时间戳、帧索引与任务索引实现跨模态数据对齐,为模仿学习与视觉伺服控制研究提供结构化支撑。
使用方法
研究者可通过HuggingFace平台直接加载该数据集,利用标准数据加载器解析Parquet文件与关联视频流。数据读取时应重点关注动作空间与观测空间的维度对应关系,12维关节控制指令可直接映射至机器人驱动器。建议采用帧索引机制实现多模态数据同步,视频解码时需注意AV1编码格式兼容性,所有训练样本已按时间连续性与任务完整性进行预处理。
背景与挑战
背景概述
机器人学习领域近年来致力于开发能够适应复杂环境的智能体,dataset_test数据集作为LeRobot项目的重要组成部分,聚焦于双臂机器人的动作控制与感知融合研究。该数据集通过记录双自由度机械臂的关节位置数据与多视角视觉信息,构建了包含50个完整任务序列的交互轨迹库,其结构化特征涵盖12维动作空间与480p三通道视觉观测,为模仿学习与强化学习算法提供了真实世界的行为范本。
当前挑战
该数据集需解决机器人动作规划中高维状态空间的表征学习难题,其双机械臂协同控制要求算法同时处理24个关节自由度与多模态感知的时序对齐。构建过程中面临传感器同步精度与数据一致性的技术瓶颈,每秒30帧的视觉流与关节轨迹需保持严格时序对应,而大规模视频数据的压缩存储与实时解析亦对计算架构提出严峻考验。
常用场景
经典使用场景
在机器人学习领域,该数据集通过双机械臂系统的多模态数据记录,为模仿学习与强化学习算法提供了标准化的训练环境。其包含的关节位置控制指令与多视角视觉观测序列,能够有效支撑端到端策略网络的训练过程,尤其在双臂协调操作任务中展现出重要价值。
解决学术问题
该数据集主要解决了机器人领域缺乏高质量双臂操作基准数据的问题,为研究多传感器融合、跨模态表示学习等课题提供实证基础。通过精确的时间戳对齐与多维度状态记录,显著提升了动作预测模型的泛化能力,推动了机器人感知-控制闭环系统的理论发展。
衍生相关工作
基于该数据集的特性,衍生出多智能体协同操作框架、视觉-动作跨模态预训练模型等经典研究。部分工作通过时空注意力机制挖掘视频序列中的长期依赖关系,另一些研究则探索了基于元学习的快速适应策略,持续推动着机器人学习范式的革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作