five

simtos_one_item_terminate

收藏
Hugging Face2026-04-07 更新2026-04-08 收录
下载链接:
https://huggingface.co/datasets/rainbowrobotics/simtos_one_item_terminate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人技术相关任务。数据集包含30个episodes,总计4956帧,涉及2个任务。数据以parquet文件格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为15fps。数据集包含多个特征,如动作状态(16个浮点数值,对应右臂、左臂和左右夹持器的各个关节)、观察状态(同样16个浮点数值)、以及来自前、右、左三个视角的图像(分辨率为480x640和640x480,3通道)。此外,还包括时间戳、帧索引、episode索引、任务索引等元数据。数据集适用于机器人控制、行为模仿等研究场景。
创建时间:
2026-04-04
原始信息汇总

数据集概述

基本信息

  • 数据集名称: simtos_one_item_terminate
  • 托管平台: Hugging Face
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot

数据集规模与结构

  • 总情节数: 30
  • 总帧数: 4956
  • 总任务数: 2
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 15 FPS
  • 数据分割: 全部数据(第0至30个情节)用于训练

数据文件与路径

  • 数据文件格式: Parquet
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

  • 数据类型: float32
  • 形状: [16]
  • 特征名称:
    • right_arm_0 至 right_arm_6
    • left_arm_0 至 left_arm_6
    • right_gripper_0
    • left_gripper_0

观测状态

  • 数据类型: float32
  • 形状: [16]
  • 特征名称: 与动作特征相同

观测图像

前视图像

  • 数据类型: 视频
  • 形状: [480, 640, 3]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 15
    • 通道数: 3
    • 无音频

右侧图像

  • 数据类型: 视频
  • 形状: [640, 480, 3]
  • 视频信息:
    • 高度: 640
    • 宽度: 480
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 15
    • 通道数: 3
    • 无音频

左侧图像

  • 数据类型: 视频
  • 形状: [640, 480, 3]
  • 视频信息: 与右侧图像相同

元数据

  • 时间戳: float32, 形状 [1]
  • 帧索引: int64, 形状 [1]
  • 情节索引: int64, 形状 [1]
  • 索引: int64, 形状 [1]
  • 任务索引: int64, 形状 [1]

附加信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用信息: 未提供
  • 可视化链接: https://huggingface.co/spaces/lerobot/visualize_dataset?path=rainbowrobotics/simtos_one_item_terminate
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是推动算法发展的基石。simtos_one_item_terminate数据集依托LeRobot平台构建,通过仿真环境采集了双臂机器人RB-Y1执行物品操作任务的交互数据。该数据集包含30个完整的情节,总计4956帧,以15帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每块约1000帧,确保了高效的数据管理与读取。构建过程系统性地捕获了机器人的关节状态、夹爪动作以及多视角的视觉观测,为模仿学习与强化学习研究提供了结构化的仿真数据源。
特点
该数据集在机器人操作任务数据中展现出鲜明的多模态特性。其核心特征在于同步提供了高维的动作向量与状态观测,动作空间涵盖左右机械臂各7个关节及夹爪的16维连续控制指令。观测部分则融合了本体16维关节状态与三个不同视角的RGB视频流,前方摄像头分辨率为480x640,左右视角为640x480,均以AV1编码存储。数据结构设计清晰,包含时间戳、帧索引、情节索引等元数据,支持按任务或情节进行灵活的数据切片与检索,为复杂策略的端到端训练奠定了坚实基础。
使用方法
对于致力于机器人技能学习的研究者而言,该数据集可直接通过Hugging Face数据集库加载与使用。数据已预分割为训练集,涵盖全部30个情节。用户可依据`episode_index`或`task_index`选取特定情节或任务进行分析,亦可通过`frame_index`进行逐帧访问。多模态观测与动作数据便于构建状态-动作映射模型,而附带的视频文件可用于可视化验证或基于视觉的表示学习。数据集遵循Apache 2.0许可,鼓励在学术与工业场景中自由用于模型训练、算法基准测试以及仿真系统的验证工作。
背景与挑战
背景概述
在机器人学习领域,高质量仿真数据集对于推动模仿学习与强化学习算法的进步至关重要。simtos_one_item_terminate数据集依托LeRobot平台构建,专注于双臂机器人操作任务,旨在通过仿真环境采集机器人状态与视觉观测数据,以支持端到端策略学习的研究。该数据集由HuggingFace社区发布,采用Apache 2.0许可,其核心研究问题在于如何利用多模态观测信息训练机器人完成精准的物品操作与终止任务,为仿真到真实世界的迁移学习提供基础数据支撑。
当前挑战
该数据集致力于解决机器人操作任务中的策略泛化与多模态感知融合挑战,尤其在复杂场景下如何从视觉与状态数据中学习鲁棒控制策略。构建过程中面临数据采集的规模与多样性限制,仅包含30个训练片段,可能影响模型泛化能力;同时,多视角视频数据与高维动作空间的同步对齐增加了数据处理复杂度,而仿真环境与真实物理世界的差异也为后续迁移应用带来潜在障碍。
常用场景
经典使用场景
在机器人学习领域,simtos_one_item_terminate数据集为双臂机器人操作任务提供了标准化的仿真环境。该数据集通过记录RB-Y1型机器人在模拟场景中执行单一物品抓取与终止动作的完整轨迹,包括多视角视觉观测、关节状态与动作指令,成为训练端到端机器人策略模型的经典基准。研究者利用其结构化的序列数据,能够高效验证模仿学习与强化学习算法在复杂操作任务中的泛化能力,推动机器人自主决策技术的发展。
衍生相关工作
围绕该数据集,机器人学习社区已衍生出一系列经典研究工作。这些工作主要集中于改进基于视觉的模仿学习框架、开发高效的行为克隆算法,以及探索多任务策略的泛化机制。部分研究进一步利用其多视角视频数据,推进了机器人场景理解与手眼协调模型的发展,为后续更复杂的操作数据集构建与算法评估奠定了坚实的理论与实验基础。
数据集最近研究
最新研究方向
在机器人操作领域,simtos_one_item_terminate数据集作为基于LeRobot框架生成的仿真数据,正推动模仿学习与视觉运动控制的前沿探索。该数据集聚焦于双臂机器人执行单一物品终止任务,其多视角视频流与高维动作状态记录,为研究跨模态表征学习提供了关键资源。当前热点集中于利用此类数据训练端到端策略模型,以提升机器人在非结构化环境中的泛化能力,同时结合自监督学习技术,从有限演示中挖掘可迁移技能。这一方向不仅加速了仿真到实物的迁移进程,也为家庭服务与工业自动化场景中的灵巧操作奠定了数据基础,具有显著的实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作