five

eval_SmolVLA-100-180k-544p

收藏
Hugging Face2026-03-12 更新2026-03-12 收录
下载链接:
https://huggingface.co/datasets/castlejin/eval_SmolVLA-100-180k-544p
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为HuggingFace LeRobot格式机器人数据集。
提供机构:
castlejin
创建时间:
2026-03-12
原始信息汇总

数据集概述

基本描述

  • 数据集名称: eval_SmolVLA-100-180k-544p
  • 创建工具: 使用LeRobot创建
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集结构

  • 数据格式: Parquet文件
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据总量: 100 MB
  • 视频总量: 200 MB
  • 分块大小: 1000帧
  • 帧率: 30 FPS

数据规模

  • 总任务数: 1
  • 总情节数: 2
  • 总帧数: 10137
  • 训练集划分: 情节索引0到2

特征字段

动作

  • 字段名: action
  • 数据类型: float32
  • 形状: [6]
  • 描述: 包含6个关节的位置信息
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测状态

  • 字段名: observation.state
  • 数据类型: float32
  • 形状: [6]
  • 描述: 包含与动作相同的6个关节位置信息

顶部摄像头图像

  • 字段名: observation.images.top
  • 数据类型: 视频
  • 形状: [544, 720, 3] (高度, 宽度, 通道)
  • 视频信息:
    • 高度: 544像素
    • 宽度: 720像素
    • 编解码器: AV1
    • 像素格式: yuv420p
    • 是否为深度图: 否
    • 帧率: 30 FPS
    • 通道数: 3
    • 包含音频: 否

腕部摄像头图像

  • 字段名: observation.images.wrist
  • 数据类型: 视频
  • 形状: [544, 720, 3] (高度, 宽度, 通道)
  • 视频信息: 与顶部摄像头图像相同

元数据字段

  • timestamp: 时间戳 (float32, 形状[1])
  • frame_index: 帧索引 (int64, 形状[1])
  • episode_index: 情节索引 (int64, 形状[1])
  • index: 索引 (int64, 形状[1])
  • task_index: 任务索引 (int64, 形状[1])

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so_follower

缺失信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用BibTeX: 未提供
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作