five

dataset_deltas_lvfm_v10

收藏
Hugging Face2026-04-26 更新2026-04-26 收录
下载链接:
https://huggingface.co/datasets/Tsagkas/dataset_deltas_lvfm_v10
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为HuggingFace LeRobot格式机器人数据集。

This dataset is a HuggingFace LeRobot format robot dataset.
提供机构:
Tsagkas
创建时间:
2026-04-26
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Tsagkas/dataset_deltas_lvfm_v10
  • 许可证: Apache-2.0
  • 任务类别: 机器人技术 (Robotics)
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集规模与结构

  • 总片段数 (episodes): 48
  • 总帧数 (frames): 6,685
  • 总任务数 (tasks): 2
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率 (FPS): 10
  • 分块大小 (chunks_size): 1,000
  • 数据划分: 训练集 (train) 包含全部 48 个片段 (0:48)

机器人类型

  • 机器人型号: so101_follower

数据文件路径

  • 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据集特征 (Features)

特征名称 数据类型 形状 说明
action float32 (7,) 动作指令:包含末端执行器位置 (x, y, z)、姿态 (wx, wy, wz) 和夹爪位置 (gripper_pos)
observation.state float32 (7,) 观测状态:包含夹爪位置、末端执行器姿态和位置
observation.images.wrist video (256, 256, 3) 腕部摄像头图像,分辨率 256x256,3 通道,编码格式 AV1
observation.images.front video (256, 256, 3) 前方摄像头图像,分辨率 256x256,3 通道,编码格式 AV1
observation.vfm_features.wrist float32 (16, 16, 768) 腕部基础模型视觉特征 (VFM features)
observation.vfm_features.front float32 (16, 16, 768) 前方基础模型视觉特征 (VFM features)
observation.skill_feature float32 (1024,) 技能特征向量
observation.object_feature float32 (1024,) 物体特征向量
observation.full_text_features float32 (77, 1024) 完整文本特征(序列长度为 77)
observation.vlm_features.wrist float32 (16, 16, 1024) 腕部视觉语言模型特征 (VLM features)
observation.vlm_features.front float32 (16, 16, 1024) 前方视觉语言模型特征 (VLM features)
timestamp float32 (1,) 时间戳
frame_index int64 (1,) 帧索引
episode_index int64 (1,) 片段索引
index int64 (1,) 全局索引
task_index int64 (1,) 任务索引

引用信息

  • 论文: 暂无信息
  • 主页: 暂无信息
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作