simtos_one_item_terminate

Hugging Face2026-04-07 更新2026-04-08 收录

下载链接：

https://huggingface.co/datasets/rainbowrobotics/simtos_one_item_terminate

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术相关任务。数据集包含30个episodes，总计4956帧，涉及2个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为15fps。数据集包含多个特征，如动作状态（16个浮点数值，对应右臂、左臂和左右夹持器的各个关节）、观察状态（同样16个浮点数值）、以及来自前、右、左三个视角的图像（分辨率为480x640和640x480，3通道）。此外，还包括时间戳、帧索引、episode索引、任务索引等元数据。数据集适用于机器人控制、行为模仿等研究场景。

创建时间：

2026-04-04

原始信息汇总

数据集概述

基本信息

数据集名称: simtos_one_item_terminate
托管平台: Hugging Face
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot

数据集规模与结构

总情节数: 30
总帧数: 4956
总任务数: 2
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 15 FPS
数据分割: 全部数据（第0至30个情节）用于训练

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [16]
特征名称:
- right_arm_0 至 right_arm_6
- left_arm_0 至 left_arm_6
- right_gripper_0
- left_gripper_0

观测状态

数据类型: float32
形状: [16]
特征名称: 与动作特征相同

观测图像

前视图像

数据类型: 视频
形状: [480, 640, 3]
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 15
- 通道数: 3
- 无音频

右侧图像

数据类型: 视频
形状: [640, 480, 3]
视频信息:
- 高度: 640
- 宽度: 480
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 15
- 通道数: 3
- 无音频

左侧图像

数据类型: 视频
形状: [640, 480, 3]
视频信息: 与右侧图像相同

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
情节索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

附加信息

主页: 未提供
论文: 未提供
引用信息: 未提供
可视化链接: https://huggingface.co/spaces/lerobot/visualize_dataset?path=rainbowrobotics/simtos_one_item_terminate

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集是推动算法发展的基石。simtos_one_item_terminate数据集依托LeRobot平台构建，通过仿真环境采集了双臂机器人RB-Y1执行物品操作任务的交互数据。该数据集包含30个完整的情节，总计4956帧，以15帧每秒的速率记录。数据以分块形式存储于Parquet文件中，每块约1000帧，确保了高效的数据管理与读取。构建过程系统性地捕获了机器人的关节状态、夹爪动作以及多视角的视觉观测，为模仿学习与强化学习研究提供了结构化的仿真数据源。

特点

该数据集在机器人操作任务数据中展现出鲜明的多模态特性。其核心特征在于同步提供了高维的动作向量与状态观测，动作空间涵盖左右机械臂各7个关节及夹爪的16维连续控制指令。观测部分则融合了本体16维关节状态与三个不同视角的RGB视频流，前方摄像头分辨率为480x640，左右视角为640x480，均以AV1编码存储。数据结构设计清晰，包含时间戳、帧索引、情节索引等元数据，支持按任务或情节进行灵活的数据切片与检索，为复杂策略的端到端训练奠定了坚实基础。

使用方法

对于致力于机器人技能学习的研究者而言，该数据集可直接通过Hugging Face数据集库加载与使用。数据已预分割为训练集，涵盖全部30个情节。用户可依据`episode_index`或`task_index`选取特定情节或任务进行分析，亦可通过`frame_index`进行逐帧访问。多模态观测与动作数据便于构建状态-动作映射模型，而附带的视频文件可用于可视化验证或基于视觉的表示学习。数据集遵循Apache 2.0许可，鼓励在学术与工业场景中自由用于模型训练、算法基准测试以及仿真系统的验证工作。

背景与挑战

背景概述

在机器人学习领域，高质量仿真数据集对于推动模仿学习与强化学习算法的进步至关重要。simtos_one_item_terminate数据集依托LeRobot平台构建，专注于双臂机器人操作任务，旨在通过仿真环境采集机器人状态与视觉观测数据，以支持端到端策略学习的研究。该数据集由HuggingFace社区发布，采用Apache 2.0许可，其核心研究问题在于如何利用多模态观测信息训练机器人完成精准的物品操作与终止任务，为仿真到真实世界的迁移学习提供基础数据支撑。

当前挑战

该数据集致力于解决机器人操作任务中的策略泛化与多模态感知融合挑战，尤其在复杂场景下如何从视觉与状态数据中学习鲁棒控制策略。构建过程中面临数据采集的规模与多样性限制，仅包含30个训练片段，可能影响模型泛化能力；同时，多视角视频数据与高维动作空间的同步对齐增加了数据处理复杂度，而仿真环境与真实物理世界的差异也为后续迁移应用带来潜在障碍。

常用场景

经典使用场景

在机器人学习领域，simtos_one_item_terminate数据集为双臂机器人操作任务提供了标准化的仿真环境。该数据集通过记录RB-Y1型机器人在模拟场景中执行单一物品抓取与终止动作的完整轨迹，包括多视角视觉观测、关节状态与动作指令，成为训练端到端机器人策略模型的经典基准。研究者利用其结构化的序列数据，能够高效验证模仿学习与强化学习算法在复杂操作任务中的泛化能力，推动机器人自主决策技术的发展。

衍生相关工作

围绕该数据集，机器人学习社区已衍生出一系列经典研究工作。这些工作主要集中于改进基于视觉的模仿学习框架、开发高效的行为克隆算法，以及探索多任务策略的泛化机制。部分研究进一步利用其多视角视频数据，推进了机器人场景理解与手眼协调模型的发展，为后续更复杂的操作数据集构建与算法评估奠定了坚实的理论与实验基础。

数据集最近研究