five

screwdriver_95

收藏
Hugging Face2025-11-05 更新2025-11-06 收录
下载链接:
https://huggingface.co/datasets/antwoor/screwdriver_95
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个与机器人学相关的数据集,包含动作、观察状态、两个摄像头的图像等多种特征。数据以.parquet格式存储,视频为.mp4格式。数据集的详细结构包括版本、机器人类型、总剧集数、总帧数、任务数和视频数等信息,均在info.json文件中详细描述。该数据集遵循Apache-2.0许可。
创建时间:
2025-11-01
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: mcx

数据集规模

  • 总任务数: 1
  • 总片段数: 10
  • 总帧数: 8763
  • 总视频数: 20
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 数据分割: 训练集 (0:10)

数据结构

数据文件路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作特征

  • 名称: action
  • 数据类型: float32
  • 形状: [7]
  • 关节位置: joint1.pos, joint2.pos, joint3.pos, joint4.pos, joint5.pos, joint6.pos, gripper.pos

观测特征

状态观测:

  • 名称: observation.state
  • 数据类型: float32
  • 形状: [7]
  • 关节位置: joint1.pos, joint2.pos, joint3.pos, joint4.pos, joint5.pos, joint6.pos, gripper.pos

图像观测: 相机1:

  • 名称: observation.images.camera_1
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 通道数: 3
    • 帧率: 30 fps
    • 编码格式: av1
    • 像素格式: yuv420p
    • 非深度图
    • 无音频

相机2:

  • 名称: observation.images.camera_2
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 通道数: 3
    • 帧率: 30 fps
    • 编码格式: av1
    • 像素格式: yuv420p
    • 非深度图
    • 无音频

索引特征

  • 时间戳: timestamp (float32, [1])
  • 帧索引: frame_index (int64, [1])
  • 片段索引: episode_index (int64, [1])
  • 索引: index (int64, [1])
  • 任务索引: task_index (int64, [1])

创建信息

  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,screwdriver_95数据集依托LeRobot框架精心构建,通过记录机械臂执行单一任务的过程,系统采集了10个完整操作序列。数据以分块形式存储于Parquet文件中,每块包含1000帧记录,总计8763帧视觉与动作数据,采样频率稳定在30赫兹,确保时序连贯性。
特点
该数据集呈现多维异构特性,同时囊括七自由度机械臂的关节位置、夹爪状态等动作向量,以及双视角RGB视频流。所有传感器数据均以标准化浮点格式存储,视频流采用AV1编码压缩,分辨率达640×480像素,兼具空间细节与时效连续性,为模仿学习研究提供丰富感知素材。
使用方法
研究者可通过解析Parquet文件直接获取结构化数据,利用帧索引与时间戳实现多模态对齐。训练集涵盖全部10个任务片段,支持端到端策略学习或行为克隆模型开发。视频数据与状态观测值的并行调用机制,便于构建视觉-动作映射关系,推进机器人操作技能的智能迁移。
背景与挑战
背景概述
机器人操作数据集screwdriver_95诞生于机器人技术蓬勃发展的时代,由HuggingFace的LeRobot项目团队构建。该数据集聚焦于机械臂精细化操作任务,通过记录六轴关节机器人在执行螺丝刀操作过程中的多模态数据,为模仿学习与强化学习算法提供训练基础。其核心研究目标在于解决机器人对工具使用的动作泛化问题,通过包含8763帧高精度关节位置数据与双视角视觉信息,显著提升了机器人执行复杂装配任务的能力,对工业自动化与智能机器人领域具有重要推动作用。
当前挑战
在机器人操作领域,该数据集致力于攻克动态环境下的工具操作泛化难题,其核心挑战在于如何从有限演示样本中学习具有适应性的操作策略。数据构建过程中面临多源传感器同步采集的技术瓶颈,需确保7维关节动作数据与双路视觉流在30Hz采样频率下的时空对齐。此外,高维连续动作空间与视觉观测的异构融合对表征学习提出严峻考验,而仅包含单一任务类型的数据规模限制也制约了模型的跨任务迁移能力。
常用场景
经典使用场景
在机器人操作任务研究领域,screwdriver_95数据集以其丰富的多模态数据为机器人控制算法开发提供了重要支撑。该数据集通过记录机械臂执行螺丝刀操作任务时的关节位置、夹爪状态及双视角视觉信息,典型应用于模仿学习与强化学习算法的训练与验证。研究人员能够利用这些同步采集的动作序列与视觉观测数据,构建从感知到控制的端到端策略模型,推动机器人精细操作能力的提升。
解决学术问题
该数据集有效解决了机器人学中动态环境下的精细操作策略泛化问题。通过提供真实场景下的连续动作轨迹与多视角视觉对应关系,它支持研究者突破仿真到实物的迁移瓶颈,为具身智能中的动作表示学习、多模态融合感知等核心课题提供实证基础。其标准化数据格式显著降低了机器人学习算法的验证门槛,对促进跨机构研究成果可比性具有深远意义。
衍生相关工作
围绕该数据集衍生的研究已催生多项创新工作,包括基于时空注意力的操作策略网络、多视角视觉特征融合架构等。这些成果通过提取数据集中隐含的动作语义模式,发展了分层强化学习、元策略迁移等新方法。相关技术路线进一步拓展至其他工具使用任务,形成了机器人操作知识迁移的研究范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作