jskim/sft2nic_target_card2_port1_randomized

Name: jskim/sft2nic_target_card2_port1_randomized
Creator: jskim
Published: 2026-04-30 21:02:51
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/jskim/sft2nic_target_card2_port1_randomized

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，属于机器人领域。数据集包含339个episodes，共217046帧，帧率为20fps。数据以parquet格式存储，视频以mp4格式存储。数据集包含多个特征，如动作（delta_position和delta_rotation）、观察状态（tcp_pose、tcp_velocity、tcp_error、joint_positions、wrist_wrench等）、图像观察（left_camera、center_camera、right_camera）以及时间戳、帧索引、episode索引等。数据集使用Apache 2.0许可证。

This dataset was created by LeRobot and belongs to the robotics domain. It contains 339 episodes with a total of 217046 frames at 20fps. The data is stored in parquet format, and videos are stored in mp4 format. The dataset includes multiple features such as actions (delta_position and delta_rotation), observation states (tcp_pose, tcp_velocity, tcp_error, joint_positions, wrist_wrench, etc.), image observations (left_camera, center_camera, right_camera), as well as timestamps, frame indices, episode indices, etc. The dataset is licensed under Apache 2.0.

提供机构：

jskim

搜集汇总

数据集介绍

构建方式

该数据集依托于开源的LeRobot框架构建，专注于机器人操作任务的模拟与记录。通过UR5e机械臂搭载AIC控制器，在随机化的环境下执行‘卡片插入’（card2_port1）任务，共计采集339个操作回合（episodes），累计21.7万帧数据。数据以Parquet格式存储动作与状态序列，每1000帧为一个数据块，同时以AV1编码的MP4视频文件保存多视角视觉观测，包括左、中、右三路摄像头画面，分辨率统一为256×288像素。

使用方法

利用LeRobot库可直接加载该数据集进行训练与评估。用户通过指定数据集路径，即可获得标准化格式的动作、状态及图像序列，适合复现模仿学习或强化学习算法。数据集已划分训练集（全部339个回合），无需额外分割。视频与Parquet数据按块索引组织，便于流式读取。推荐应用场景包括机器人抓取、精密装配等任务的策略学习与仿真验证。

背景与挑战

背景概述

在机器人学习领域，模仿学习与示教学习技术的快速发展对高质量、可复现的数据集提出了迫切需求。sft2nic_target_card2_port1_randomized数据集由Hugging Face LeRobot项目创建，采用Apache-2.0许可协议公开发布，旨在为机器人操作技能学习提供结构化、多模态的演示数据。该数据集由研究人员利用UR5e协作机械臂与AIC控制器构建，记录了339个演示回合、超过21万帧的精细操作序列，专注于“精确插入”这一核心任务。通过融合三视角视觉图像、机器人末端执行器位姿、关节角度及力/力矩信息，数据集为探索基于视觉-运动控制的智能策略铺平了道路，成为机器人操作领域重要的基准资源。

当前挑战

该数据集的核心挑战在于解决精密装配操作中的高精度控制问题，具体表现为末端执行器需在毫米级误差范围内完成目标卡的插入任务，这对机械臂的柔顺控制与环境感知能力提出严苛要求。构建过程中遇到的挑战包括：同步采集多台摄像头以20帧/秒的速率获取高分辨率图像、对齐视觉数据与32维状态量（如TCP误差、腕部力/扭矩）的时间戳，以及确保每个演示回合的动作序列具有可复现性。此外，随机化初始位置与视角条件增加了数据多样性，但也加剧了从高维异构特征中学习稳健策略的难度，使得该数据集成为评测复杂机器人技能习得方法的重要试金石。

常用场景

经典使用场景

在机器人学习与操作领域，数据集sft2nic_target_card2_port1_randomized围绕UR5e机械臂与AIC控制器的真实物理交互，记录了339个演示回合、超过21万帧的高频时序数据，涵盖三视角视觉图像、关节状态、TCP位姿及腕部力/扭矩等多模态信息。该数据集被广泛用于模仿学习、行为克隆及端到端机器人操控的模型训练与验证，特别是在有限样本条件下学习精密插拔、目标对准等接触式任务的策略泛化能力，成为评估机器人从人类演示中捕捉精细运动技能的标准基准之一。

解决学术问题

该数据集攻克了机器人操作领域中多模态数据对齐与复杂接触任务策略可复现性的难题。通过提供同步的视觉-本体-力觉序列，它支撑了研究者对位姿误差修正、阻抗控制参数自适应及碰撞规避算法的定量分析。其公开的标准化数据格式消除了不同实验室间硬件差异导致的比较障碍，推动了动作生成模型在接触状态感知、非刚性物体操控等方面的学术突破，为从演示中提取因果操作规则的理论探索提供了可靠的数据基石。

实际应用

在工业自动化与智能服务场景中，该数据集赋能了柔顺装配、电子元件插接等精密工序的少样本部署方案。依托其记录的力觉与视觉协同数据，制造商能够训练机械臂在传感器噪声和零件公差波动下仍稳定完成高精度对接操作。此外，数据集中随机化的初始位姿与光照变化，助力开发了适应家庭服务、医疗辅助等非结构化环境的鲁棒操作策略，显著降低了传统手工编程的调试成本与安全风险。

数据集最近研究