dataset-lvfm-v0
收藏Hugging Face2026-01-26 更新2026-01-26 收录
下载链接:
https://huggingface.co/datasets/Tsagkas/dataset-lvfm-v0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,主要用于机器人技术领域。数据集包含60个episodes,3976帧,4个任务,数据以parquet格式存储。数据集包含多种特征,如动作(action)、观察状态(observation.state)、图像(observation.images.wrist/front)、视觉特征(observation.vfm_features.wrist/front)、技能特征(observation.skill_feature)、物体特征(observation.object_feature)、视觉语言模型特征(observation.vlm_features.wrist/front)等。数据集的视频分辨率为256x256,帧率为10fps。
提供机构:
Tsagkas
创建时间:
2026-01-21
原始信息汇总
数据集概述
基本信息
- 数据集名称: Tsagkas/dataset-lvfm-v0
- 创建工具: 使用 LeRobot 创建。
- 任务类别: 机器人学
- 标签: LeRobot
- 许可证: Apache 2.0
- 主页: 未提供
- 论文: 未提供
数据集规模与结构
- 总情节数: 60
- 总帧数: 3976
- 总任务数: 4
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 10 FPS
- 数据分割: 仅包含训练集,涵盖所有60个情节。
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据特征
数据集包含以下主要特征:
动作
- 数据类型:
float32 - 形状:
[7] - 描述: 包含末端执行器的位置 (
ee.x,ee.y,ee.z)、角速度 (ee.wx,ee.wy,ee.wz) 和夹爪位置 (ee.gripper_pos)。
观测
-
状态观测
- 数据类型:
float32 - 形状:
[7] - 描述: 包含夹爪位置、末端执行器角速度和位置。
- 数据类型:
-
图像观测
- 手腕摄像头图像
- 数据类型:
video - 形状:
[256, 256, 3] - 视频信息: 高度256像素,宽度256像素,编码器为av1,像素格式为yuv420p,非深度图,帧率10 FPS,3个通道,无音频。
- 数据类型:
- 前视摄像头图像
- 数据类型:
video - 形状:
[256, 256, 3] - 视频信息: 高度256像素,宽度256像素,编码器为av1,像素格式为yuv420p,非深度图,帧率10 FPS,3个通道,无音频。
- 数据类型:
- 手腕摄像头图像
-
视觉特征观测
- 手腕摄像头VFM特征
- 数据类型:
float32 - 形状:
[16, 16, 768]
- 数据类型:
- 前视摄像头VFM特征
- 数据类型:
float32 - 形状:
[16, 16, 768]
- 数据类型:
- 手腕摄像头VLM特征
- 数据类型:
float32 - 形状:
[16, 16, 1024]
- 数据类型:
- 前视摄像头VLM特征
- 数据类型:
float32 - 形状:
[16, 16, 1024]
- 数据类型:
- 手腕摄像头VFM特征
-
技能与物体特征
- 技能特征
- 数据类型:
float32 - 形状:
[1024]
- 数据类型:
- 物体特征
- 数据类型:
float32 - 形状:
[1024]
- 数据类型:
- 技能特征
索引与元数据
- 时间戳:
float32,形状[1] - 帧索引:
int64,形状[1] - 情节索引:
int64,形状[1] - 索引:
int64,形状[1] - 任务索引:
int64,形状[1]
引用信息
- BibTeX引用格式: 未提供。



