five

sfp_dataset

收藏
Hugging Face2026-04-19 更新2026-04-20 收录
下载链接:
https://huggingface.co/datasets/pvrohin/sfp_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是与机器人技术相关的开源数据集,采用Apache-2.0许可协议。数据集由LeRobot项目创建,包含以parquet格式存储的数据文件和MP4格式的视频文件。数据集结构通过meta/info.json文件详细描述,包括机器人类型(ur5e_aic)、总情节数(3)、总帧数(3841)、总任务数(1)、数据块大小(1000)、数据文件大小(100MB)、视频文件大小(200MB)以及帧率(30fps)。数据集特征包括动作数据(6维浮点数组)、观察数据(26维状态向量和来自左、中、右三个相机的256x288 RGB视频帧)、时间戳和各种索引信息。该数据集适用于机器人控制、视觉感知等相关研究任务。
创建时间:
2026-04-11
原始信息汇总

数据集概述

基本信息

  • 数据集名称: pvrohin/sfp_dataset
  • 创建工具: 使用 LeRobot 创建。
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模与结构

  • 总情节数: 3
  • 总帧数: 3841
  • 总任务数: 1
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS
  • 数据分割: 训练集 (0:3)

数据特征

数据集包含以下特征字段:

动作

  • 数据类型: float32
  • 形状: [6]
  • 名称: linear.x, linear.y, linear.z, angular.x, angular.y, angular.z

观测状态

  • 数据类型: float32
  • 形状: [26]
  • 名称: tcp_pose.position.x, tcp_pose.position.y, tcp_pose.position.z, tcp_pose.orientation.x, tcp_pose.orientation.y, tcp_pose.orientation.z, tcp_pose.orientation.w, tcp_velocity.linear.x, tcp_velocity.linear.y, tcp_velocity.linear.z, tcp_velocity.angular.x, tcp_velocity.angular.y, tcp_velocity.angular.z, tcp_error.x, tcp_error.y, tcp_error.z, tcp_error.rx, tcp_error.ry, tcp_error.rz, joint_positions.0, joint_positions.1, joint_positions.2, joint_positions.3, joint_positions.4, joint_positions.5, joint_positions.6

观测图像

包含三个摄像头视角的图像数据,均为视频格式:

  • 左摄像头: observation.images.left_camera
  • 中心摄像头: observation.images.center_camera
  • 右摄像头: observation.images.right_camera

图像参数:

  • 数据类型: video
  • 形状: [256, 288, 3] (高度,宽度,通道)
  • 视频编码: av1
  • 像素格式: yuv420p
  • 是否为深度图: false
  • 帧率: 30 FPS
  • 通道数: 3
  • 包含音频: false

索引与元数据

  • 时间戳: float32, 形状 [1]
  • 帧索引: int64, 形状 [1]
  • 情节索引: int64, 形状 [1]
  • 索引: int64, 形状 [1]
  • 任务索引: int64, 形状 [1]

文件存储

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

其他信息

  • 代码库版本: v3.0
  • 机器人类型: ur5e_aic
  • 主页: 信息缺失
  • 论文: 信息缺失
  • 引用格式: 信息缺失
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,高质量的数据集对于推动算法创新至关重要。sfp_dataset依托LeRobot平台构建,采用UR5e机械臂在真实物理环境中执行任务,通过多视角摄像头与传感器同步采集数据。该数据集以Parquet格式存储,包含3个完整任务片段,总计3841帧,数据采集频率为30赫兹,确保了时间序列的连贯性。数据被划分为多个块,每块约1000帧,便于高效加载与处理,同时配套视频文件以AV1编码存储,为视觉感知研究提供了丰富的多模态信息源。
特点
sfp_dataset的显著特征在于其多维度的数据融合能力,不仅包含六维动作向量与二十六维状态观测,还整合了左、中、右三个视角的同步视频流,每帧图像分辨率为256×288像素。这种设计使得数据集能够全面捕捉机械臂的位姿、速度、关节角度及末端执行器误差,为模仿学习与强化学习算法提供了精确的时空对齐信息。数据集结构清晰,特征字段定义明确,支持直接用于训练端到端的机器人控制模型,尤其在多传感器融合与视觉伺服任务中展现出独特价值。
使用方法
使用sfp_dataset时,研究者可通过HuggingFace平台直接访问数据文件,利用LeRobot提供的工具链进行可视化与分析。数据集已预设训练集划分,涵盖全部3个任务片段,用户可依据帧索引、片段索引等字段灵活提取子序列。对于模型训练,建议结合动作、状态观测与图像特征进行联合建模,视频数据可按需解码为帧序列,以支持时序预测任务。该数据集兼容主流机器学习框架,其模块化存储格式便于分布式加载,适合用于机器人行为克隆、轨迹规划等前沿研究。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据对于推动机器人技能泛化与自主决策研究至关重要。sfp_dataset作为一项基于LeRobot开源框架构建的机器人操作数据集,其核心研究问题聚焦于如何通过多模态感知数据(如视觉图像与机器人状态信息)来训练机器人执行复杂的操作任务。该数据集由Hugging Face社区贡献者pvrohin于近期发布,采用Apache 2.0开源协议,旨在为机器人模仿学习与强化学习算法提供丰富的训练与评估资源。尽管数据集的具体创建时间与相关论文信息尚未公开,但其结构设计体现了当前机器人学习研究中对时序动作序列、多视角视觉观测以及精确状态表征的重视,有望促进机器人操作策略在真实环境中的迁移与应用。
当前挑战
sfp_dataset所针对的机器人操作任务,其核心挑战在于如何从高维、异构的多模态数据中学习鲁棒且可泛化的策略。具体而言,机器人操作需处理视觉感知的视角变化、光照干扰以及物体遮挡等问题,同时还需精确协调末端执行器的位姿与速度控制,以完成精细的操作动作。在数据集构建过程中,挑战同样显著:大规模真实机器人数据采集成本高昂,需确保数据在时序上的一致性以及动作与观测的精确对齐;多路视频流与状态数据的同步存储与高效管理带来了工程复杂性;此外,数据标注的缺失要求算法具备从原始交互数据中自主学习的能力,这对数据集的规模与多样性提出了更高要求。
常用场景
经典使用场景
在机器人学习领域,sfp_dataset以其丰富的多模态数据为机器人技能模仿提供了经典范例。该数据集通过UR5e机械臂采集了包含多视角视觉观测、末端执行器状态以及关节位置的高维序列,为研究者构建端到端的模仿学习模型奠定了数据基础。其结构化特征使得算法能够从视觉输入直接映射到连续动作空间,从而模拟人类示教行为,实现精准的物体操作任务。
实际应用
在实际工业与实验室环境中,sfp_dataset可直接用于训练机械臂执行精细的抓取、放置或装配操作。其多摄像头视角数据能够增强模型在复杂光照与遮挡条件下的鲁棒性,适用于柔性生产线或科研平台的自动化任务。基于此数据集开发的策略可部署于UR5e等通用机械臂,提升其在物流分拣、实验室样品处理等场景中的自主性与适应性,降低对硬编码程序的依赖。
衍生相关工作
围绕sfp_dataset,已衍生出一系列专注于视觉运动策略学习的经典工作。例如,基于其多模态序列,研究者开发了时空注意力模型以提升长程任务的理解能力;亦有工作利用其动作与状态标签探索了逆强化学习与动态建模的结合。这些研究进一步拓展了数据集中视觉-动作对应关系的理论框架,为后续大规模机器人数据集构建与跨任务迁移学习提供了方法论借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作