five

test-dataset-106

收藏
Hugging Face2025-05-17 更新2025-05-18 收录
下载链接:
https://huggingface.co/datasets/willnorris/test-dataset-106
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学习数据集,包含了一个机器人的运动和观察数据。数据集共有1个任务,2个视频,每个视频包含262帧,分为1个数据块,每个数据块包含1000个数据点。数据集的视频帧率为30fps,视频格式为av1编码,分辨率是480x640,没有音频。数据集的特征包括两个摄像头的视频数据、机器人的状态、动作、时间戳、帧索引、集索引、任务索引以及一个表示任务是否完成的标志。
创建时间:
2025-05-13
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (Robotics)
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集结构

  • 配置名称: default
  • 数据文件: data/*/*.parquet

元数据 (meta/info.json)

  • 代码库版本: v2.1
  • 机器人类型: so100
  • 总集数: 1
  • 总帧数: 262
  • 总任务数: 1
  • 总视频数: 2
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (FPS): 30
  • 分割:
    • 训练集: 0:1
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  1. 观测数据:
    • 图像 (cam1, cam2):
      • 数据类型: 视频
      • 形状: [480, 640, 3] (高度, 宽度, 通道)
      • 视频信息:
        • 帧率: 30.0
        • 编解码器: av1
        • 像素格式: yuv420p
        • 深度图:
        • 音频:
    • 状态:
      • 数据类型: float32
      • 形状: [6]
      • 名称: 肩部平移, 肩部升降, 肘部弯曲, 手腕弯曲, 手腕旋转, 夹持器
  2. 动作数据:
    • 数据类型: float32
    • 形状: [6]
    • 名称: 同观测状态
  3. 其他字段:
    • 时间戳: float32, 形状 [1]
    • 帧索引: int64, 形状 [1]
    • 集索引: int64, 形状 [1]
    • 任务索引: int64, 形状 [1]
    • 完成标记: bool, 形状 [1]
    • 索引: int64, 形状 [1]

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,专为机器人技术研究设计。数据以分块形式组织,每个分块包含多个episode,每个episode以parquet格式存储。数据采集过程中使用了SO100型机器人,记录了包括双摄像头视频、机器人状态、动作指令以及时间戳等多模态信息。视频数据采用AV1编码,分辨率为480x640,帧率为30fps,确保了数据的完整性和时效性。
特点
数据集涵盖了262帧的多模态机器人操作数据,包含双摄像头视频流、6自由度机械臂状态及动作信息。视频数据采用标准化格式存储,附带详细的元数据描述。数据以episode为单位组织,支持按时间索引快速检索。特别值得注意的是,数据集提供了完整的机器人运动学链信息,包括肩部、肘部、腕部等关节的精确运动数据,为机器人控制算法研究提供了丰富的训练素材。
使用方法
使用者可通过parquet文件直接访问结构化数据,视频数据则存储在独立路径下。数据集已预设训练集划分,支持按episode索引加载特定片段。研究者可利用提供的机器人状态和动作数据开发控制算法,或基于视觉数据开发感知模型。数据加载时需注意帧率同步问题,建议使用配套的元数据文件确保各模态数据的时间对齐。
背景与挑战
背景概述
test-dataset-106数据集由LeRobot项目团队构建,专注于机器人技术领域的研究与应用。该数据集通过记录机器人执行任务时的多模态数据,包括视觉信息(如双摄像头采集的图像序列)和机器人的状态与动作数据(如关节角度和抓取器状态),旨在为机器人控制、行为学习和任务规划等研究提供丰富的实验数据。数据集采用Apache-2.0许可协议,其结构设计体现了对机器人任务执行过程的细粒度记录与分析能力,为相关算法的训练与验证提供了重要支持。
当前挑战
该数据集面临的挑战主要体现在两个方面:首先,在领域问题层面,机器人技术的研究需要处理高维度的传感器数据与复杂的动作空间,如何从多模态数据中提取有效特征并实现精准控制仍是一个开放性问题;其次,在构建过程中,数据同步与标定、大规模视频数据的高效存储与检索,以及机器人状态与动作的精确记录等技术难题均需克服。此外,数据集的规模相对有限,可能影响其在复杂任务中的泛化能力,未来需进一步扩展数据量和任务多样性。
常用场景
经典使用场景
在机器人控制与行为学习领域,test-dataset-106数据集通过记录机械臂的关节状态、动作指令及多视角视觉数据,为模仿学习与强化学习算法提供了丰富的训练素材。其包含的时序动作-观测对特别适合用于训练端到端的机器人策略模型,研究者可通过分析cam1/cam2的双目视频流与6自由度关节数据的对应关系,构建视觉-动作的映射模型。
实际应用
工业场景中的分拣、装配等任务可直接受益于该数据集训练的模型,双摄像头配置模拟了真实工作环境中的视觉感知需求。物流企业可利用其30fps的高频动作记录优化抓取轨迹规划,而6维关节空间数据则有助于开发更精准的逆向运动学求解器,降低实体机器人调试的时间成本。
衍生相关工作
基于该数据集的特性,已有研究团队开发了基于Transformer的多模态策略蒸馏框架,其视频-动作对的并行处理架构显著提升了动作预测的平滑性。在LeRobot生态中,该数据集常被用作基准测试工具,衍生出包括视觉伺服控制、示教学习等多个方向的对比实验研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作