eval_vla_state_modulation_v1
收藏Hugging Face2026-02-03 更新2026-02-04 收录
下载链接:
https://huggingface.co/datasets/Tsagkas/eval_vla_state_modulation_v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为HuggingFace LeRobot格式机器人数据集。
提供机构:
Tsagkas
创建时间:
2026-02-03
原始信息汇总
数据集概述
基本信息
- 数据集名称: eval_vla_state_modulation_v1
- 创建工具: 使用 LeRobot 创建。
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 数据格式: Parquet 文件
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 - 代码库版本: v3.0
- 机器人类型: so101_follower
- 帧率: 10 FPS
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 总情节数: 0
- 总帧数: 0
- 总任务数: 0
- 数据划分: 未提供
数据特征
动作
- 数据类型: float32
- 形状: [7]
- 特征名称: ee.x, ee.y, ee.z, ee.wx, ee.wy, ee.wz, ee.gripper_pos
观测状态
- 数据类型: float32
- 形状: [7]
- 特征名称: ee.gripper_pos, ee.wx, ee.wy, ee.wz, ee.x, ee.y, ee.z
观测图像
- 手腕图像:
- 数据类型: video
- 形状: [256, 256, 3]
- 特征名称: height, width, channels
- 前方图像:
- 数据类型: video
- 形状: [256, 256, 3]
- 特征名称: height, width, channels
观测视觉基础模型特征
- 手腕 VFM 特征:
- 数据类型: float32
- 形状: [16, 16, 768]
- 前方 VFM 特征:
- 数据类型: float32
- 形状: [16, 16, 768]
观测技能特征
- 数据类型: float32
- 形状: [1024]
观测物体特征
- 数据类型: float32
- 形状: [1024]
观测视觉语言模型特征
- 手腕 VLM 特征:
- 数据类型: float32
- 形状: [16, 16, 1024]
- 前方 VLM 特征:
- 数据类型: float32
- 形状: [16, 16, 1024]
索引与时间戳
- 时间戳:
- 数据类型: float32
- 形状: [1]
- 帧索引:
- 数据类型: int64
- 形状: [1]
- 情节索引:
- 数据类型: int64
- 形状: [1]
- 索引:
- 数据类型: int64
- 形状: [1]
- 任务索引:
- 数据类型: int64
- 形状: [1]
补充信息
- 主页: 未提供
- 论文: 未提供
- 引用信息: 未提供



