five

dataset-test-v2

收藏
Hugging Face2026-02-04 更新2026-02-04 收录
下载链接:
https://huggingface.co/datasets/Tsagkas/dataset-test-v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为HuggingFace LeRobot格式机器人数据集。
提供机构:
Tsagkas
创建时间:
2026-02-04
原始信息汇总

数据集概述

基本信息

  • 数据集名称: dataset-test-v2
  • 发布者: Tsagkas
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 创建工具: 使用 LeRobot 创建。

数据集规模与结构

  • 总情节数: 20
  • 总帧数: 1194
  • 总任务数: 1
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 10 FPS
  • 数据分割: 训练集包含所有20个情节。
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

数据集包含以下特征字段:

动作

  • 字段名: action
  • 数据类型: float32
  • 形状: [7]
  • 描述: 包含末端执行器的位置、旋转和夹爪位置(ee.x, ee.y, ee.z, ee.wx, ee.wy, ee.wz, ee.gripper_pos)。

观测

观测数据包含多个子字段:

状态观测

  • 字段名: observation.state
  • 数据类型: float32
  • 形状: [7]
  • 描述: 包含末端执行器的夹爪位置、旋转和位置信息。

图像观测

包含来自两个摄像头的视频数据:

  1. 手腕摄像头 (observation.images.wrist)
  2. 前置摄像头 (observation.images.front)
    • 数据类型: video
    • 形状: [256, 256, 3] (高度,宽度,通道)
    • 视频信息:
      • 编解码器: av1
      • 像素格式: yuv420p
      • 帧率: 10 FPS
      • 非深度图,无音频。

视觉特征映射观测

包含来自两个摄像头的预提取特征:

  1. 手腕摄像头 VFM 特征 (observation.vfm_features.wrist)
  2. 前置摄像头 VFM 特征 (observation.vfm_features.front)
    • 数据类型: float32
    • 形状: [16, 16, 768]

技能与物体特征

  • 技能特征 (observation.skill_feature): float32 类型,形状为 [1024]
  • 物体特征 (observation.object_feature): float32 类型,形状为 [1024]

视觉语言模型特征

包含来自两个摄像头的 VLM 特征:

  1. 手腕摄像头 VLM 特征 (observation.vlm_features.wrist)
  2. 前置摄像头 VLM 特征 (observation.vlm_features.front)
    • 数据类型: float32
    • 形状: [16, 16, 1024]

索引与元数据

  • 时间戳 (timestamp): float32 类型,形状为 [1]
  • 帧索引 (frame_index): int64 类型,形状为 [1]
  • 情节索引 (episode_index): int64 类型,形状为 [1]
  • 索引 (index): int64 类型,形状为 [1]
  • 任务索引 (task_index): int64 类型,形状为 [1]

附加信息

  • 主页: 信息缺失。
  • 相关论文: 信息缺失。
  • 引用信息 (BibTeX): 信息缺失。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作