five

eval_smolvla_place_cylinder

收藏
Hugging Face2025-07-20 更新2025-07-21 收录
下载链接:
https://huggingface.co/datasets/arpitg1304/eval_smolvla_place_cylinder
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个机器人任务数据集,包含3个视频剧集,共5171帧,1个任务。数据集以Parquet文件格式存储,每个文件包含机器人动作、状态、正面图像、时间戳、帧索引等信息。图像为480x640的彩色视频,帧率为30fps。
创建时间:
2025-07-20
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: robotics
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: so101_follower

数据集结构

  • 总集数: 3
  • 总帧数: 5171
  • 总任务数: 1
  • 总视频数: 3
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • action:
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • observation.state:
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • observation.images.front:
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: false
      • 帧率: 30 fps
      • 通道数: 3
      • 是否有音频: false
  • timestamp:
    • 数据类型: float32
    • 形状: [1]
  • frame_index:
    • 数据类型: int64
    • 形状: [1]
  • episode_index:
    • 数据类型: int64
    • 形状: [1]
  • index:
    • 数据类型: int64
    • 形状: [1]
  • task_index:
    • 数据类型: int64
    • 形状: [1]

分割

  • 训练集: 0:3

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
eval_smolvla_place_cylinder数据集依托LeRobot开源框架构建,专为机器人控制任务设计。该数据集采用模块化存储结构,将5171帧数据划分为3个完整片段,每个片段以30fps的帧率记录机械臂运动轨迹。数据以Parquet格式分块存储,每块包含1000帧,通过标准化命名规则实现高效索引,同时配套MP4格式视频文件以提供视觉参考。
特点
该数据集聚焦六自由度机械臂控制场景,完整记录各关节位置状态及末端执行器动作。其核心特征在于同步采集高分辨率(640x480)RGB视觉数据与精确的关节角度反馈,形成多模态观测空间。数据结构采用层次化设计,包含时间戳、帧索引等元信息,支持精确的时序对齐与任务划分,为强化学习算法提供丰富的训练信号。
使用方法
研究人员可通过解析Parquet文件获取结构化运动数据,结合视频流实现行为克隆或逆强化学习。数据集内置的6维动作空间与状态空间严格对应,可直接用于策略网络训练。建议利用帧索引实现数据切片,通过episode_index字段区分不同任务片段,其标准化的数据接口兼容主流机器人学习框架。
背景与挑战
背景概述
eval_smolvla_place_cylinder数据集由LeRobot团队构建,专注于机器人操作任务的研究。该数据集旨在解决机器人执行精确物体放置任务时的动作规划与环境感知问题,特别针对圆柱体物体的操作场景。数据集包含多模态数据,如机器人关节状态、视觉观测和时间戳信息,为机器人学习算法提供了丰富的训练与评估资源。其构建基于开源机器人框架LeRobot,体现了当前机器人研究中对开源协作和数据共享的重视。
当前挑战
该数据集面临的挑战主要体现在两个方面。在领域问题层面,机器人操作圆柱体物体需要解决高精度动作控制与复杂环境感知的耦合问题,这对算法的鲁棒性和泛化能力提出了较高要求。在构建过程中,数据采集的同步性与完整性是主要难点,特别是多模态数据(如关节状态与视觉数据)的时间对齐问题。此外,小规模样本(仅3个完整任务)可能限制模型的泛化能力,需要在后续版本中扩充数据多样性。
常用场景
经典使用场景
在机器人控制与操作领域,eval_smolvla_place_cylinder数据集为研究人员提供了一个标准化的测试平台,用于评估机械臂在三维空间中的精确操作能力。该数据集记录了机械臂在放置圆柱体任务中的关节位置、图像观测和时间戳等多模态数据,为算法开发与性能验证提供了丰富的实验素材。
实际应用
在工业自动化场景中,该数据集可直接应用于装配线机械臂的精度优化。基于数据集训练的模型能够提升机械臂在复杂环境中的物体抓取和放置精度,特别适用于电子元件组装、精密仪器制造等需要亚毫米级操作精度的生产环节。
衍生相关工作
该数据集已催生多项机器人学习领域的重要研究,包括基于强化学习的机械臂控制算法优化、多模态感知的端到端操作策略学习等方向。部分研究团队进一步扩展了数据集的标注维度,开发出适用于动态环境下的自适应抓取算法体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作