five

annotation-test-dataset

收藏
Hugging Face2026-02-09 更新2026-02-10 收录
下载链接:
https://huggingface.co/datasets/pokeandwiggle/annotation-test-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人技术领域。数据集包含3个episodes,6541帧,1个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为10fps。数据集的结构包括观察状态(observation.state)、动作(action)、静态RGB图像(observation.images.rgb_static)、左右RGB图像(observation.images.rgb_left和observation.images.rgb_right)等多个特征。观察状态包括18个浮点型数据,表示左右TCP的位置和四元数以及左右夹爪的状态。动作包括16个浮点型数据,表示左右TCP的位置和四元数以及左右夹爪的动作。RGB图像的分辨率为256x256,3通道,视频编码为av1,像素格式为yuv420p,无音频。
提供机构:
pokeandwiggle
创建时间:
2026-02-09
原始信息汇总

数据集概述

基本信息

  • 数据集名称: annotation-test-dataset
  • 创建工具: LeRobot
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 3
  • 总帧数: 6541
  • 总任务数: 1
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 10 FPS
  • 数据分割: 训练集 (0:3)

数据结构

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

观测状态

  • 特征名: observation.state
  • 数据类型: float32
  • 形状: [18]
  • 字段:
    • tcp_left_pos_x
    • tcp_left_pos_y
    • tcp_left_pos_z
    • tcp_left_quat_x
    • tcp_left_quat_y
    • tcp_left_quat_z
    • tcp_left_quat_w
    • tcp_right_pos_x
    • tcp_right_pos_y
    • tcp_right_pos_z
    • tcp_right_quat_x
    • tcp_right_quat_y
    • tcp_right_quat_z
    • tcp_right_quat_w
    • gripper_left_0
    • gripper_left_1
    • gripper_right_0
    • gripper_right_1

动作

  • 特征名: action
  • 数据类型: float32
  • 形状: [16]
  • 字段:
    • tcp_left_x
    • tcp_left_y
    • tcp_left_z
    • tcp_left_quat_x
    • tcp_left_quat_y
    • tcp_left_quat_z
    • tcp_left_quat_w
    • tcp_right_x
    • tcp_right_y
    • tcp_right_z
    • tcp_right_quat_x
    • tcp_right_quat_y
    • tcp_right_quat_z
    • tcp_right_quat_w
    • gripper_left
    • gripper_right

静态RGB图像观测

  • 特征名: observation.images.rgb_static
  • 数据类型: video
  • 形状: [256, 256, 3]
  • 维度名称: [height, width, channel]
  • 视频信息:
    • 视频高度: 256
    • 视频宽度: 256
    • 视频编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 10
    • 通道数: 3
    • 包含音频: false

左侧RGB图像观测

  • 特征名: observation.images.rgb_left
  • 数据类型: video
  • 形状: [256, 256, 3]
  • 维度名称: [height, width, channel]
  • 视频信息: 与静态RGB图像观测相同

右侧RGB图像观测

  • 特征名: observation.images.rgb_right
  • 数据类型: video
  • 形状: [256, 256, 3]
  • 维度名称: [height, width, channel]
  • 视频信息: 与静态RGB图像观测相同

元数据特征

  • 时间戳: timestamp (float32, 形状 [1])
  • 帧索引: frame_index (int64, 形状 [1])
  • 情节索引: episode_index (int64, 形状 [1])
  • 索引: index (int64, 形状 [1])
  • 任务索引: task_index (int64, 形状 [1])

版本信息

  • 代码库版本: v3.0
  • 机器人类型: 未指定

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX引用: 未提供
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作