Isaac-Kitchen-v1103-00

Hugging Face2025-11-24 更新2025-11-25 收录

下载链接：

https://huggingface.co/datasets/exaFLOPs09/Isaac-Kitchen-v1103-00

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人操作的 dataset，包含了100个 episodes，每个episode包含不同数量的frames。数据集提供了初始姿态、是否为第一个或最后一个frame的信息，以及机器手的动作。此外，还包括了前视摄像头和两个手腕摄像头捕捉的图像信息。数据集的结构化数据以Parquet格式存储，视频文件为MP4格式。

创建时间：

2025-11-16

原始信息汇总

Isaac-Kitchen-v1103-00 数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot

数据集规模

总情节数: 100
总帧数: 73024
总任务数: 1
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据分块大小: 1000
代码库版本: v3.0

数据划分

训练集: 0:100（全部数据）

数据结构

数据文件路径

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

环境信息

kitchen_num: 厨房编号（int64）
kitchen_sub_num: 厨房子编号（int64）
kitchen_type: 厨房类型（int64）

状态标识

initial_pose: 初始位姿（float32，6维：[x, y, qw, qx, qy, qz]）
is_first: 首帧标识（int64）
is_last: 末帧标识（int64）
subtask_index: 子任务索引（int64）

观测数据

observation.language: 语言指令（string）
observation.state: 状态观测（float32，23维：[l_x, l_y, l_z, l_r1-l_r6, r_x, r_y, r_z, r_r1-r_r6, l_gripper, r_gripper, v_x, v_y, omega]）

视觉观测

observation.images.front: 前视图像（视频，480×640×3，H.264编码）
observation.images.wrist_left: 左腕图像（视频，480×640×3，H.264编码）
observation.images.wrist_right: 右腕图像（视频，480×640×3，H.264编码）

动作与控制

action: 动作指令（float32，23维，与状态观测维度对应）

索引信息

timestamp: 时间戳（float32）
frame_index: 帧索引（int64）
episode_index: 情节索引（int64）
index: 数据索引（int64）
task_index: 任务索引（int64）

视频规格

分辨率: 640×480
色彩空间: YUV420p
编码格式: H.264
帧率: 30 FPS
音频: 无
深度图: 否

搜集汇总

数据集介绍

构建方式

在机器人学习领域，数据集的构建质量直接影响模型性能。Isaac-Kitchen-v1103-00通过LeRobot平台系统采集了100个完整任务片段，以30帧/秒的速率记录多模态数据。数据以分块存储的Parquet格式组织，每块包含1000帧观测记录，同时配备同步视频流。该构建方法通过标准化流程确保了时空一致性，为模仿学习提供了结构化基础。

使用方法

研究者可通过加载Parquet数据文件直接访问结构化观测-动作对，利用帧索引实现时序对齐。视频数据与状态数据通过统一时间戳保持同步，支持联合训练视觉-动作映射模型。数据集已预划分为训练集，可直接用于行为克隆、强化学习等算法验证，其标准化接口确保与主流机器人学习框架的兼容性。

背景与挑战

背景概述

在机器人学习领域，模拟环境数据集对于推进自主操作系统的研究具有关键意义。Isaac-Kitchen-v1103-00数据集由HuggingFace的LeRobot项目构建，专注于厨房场景下的机器人任务学习。该数据集通过整合多模态传感器数据，包括双机械臂状态、视觉观测和语言指令，旨在解决复杂环境中的机器人动作规划与执行问题。其结构化设计支持大规模模仿学习与强化学习算法的训练，为家庭服务机器人的智能化发展提供了重要数据基础。

当前挑战

该数据集致力于应对机器人操作任务中的高维状态空间建模挑战，需从异构传感器流中提取有效特征以实现精确的动作预测。构建过程中面临多源数据同步与校准的复杂性，例如协调视觉视频流与机械臂姿态数据的时间一致性。同时，数据采集需保证场景多样性与任务覆盖度，以克服现实环境中物体交互的动态不确定性，这对数据集的规模与质量提出了严格要求。

常用场景

经典使用场景

在机器人操作学习领域，Isaac-Kitchen-v1103-00数据集通过多视角视觉感知与双机械臂状态数据，为模仿学习算法提供了丰富的训练素材。其包含的73024帧厨房环境交互记录，结合语言指令与动作轨迹，能够有效支撑端到端策略网络的训练过程，尤其在复杂任务分解与动态环境适应方面展现出独特价值。

解决学术问题

该数据集通过结构化存储的机器人状态空间与动作空间数据，解决了传统强化学习中样本效率低下的核心难题。其提供的23维状态特征与对应动作向量，为研究连续控制中的动力学建模、多模态感知融合等关键问题建立了基准，显著推动了具身智能在非结构化环境中的泛化能力研究。

实际应用

基于该数据集训练的模型可直接迁移至真实厨房场景，实现餐具整理、食材处理等日常任务。其包含的左右机械臂协同操作数据，为服务机器人精准抓取、力控交互等实际需求提供了技术验证平台，尤其在老年辅助与智能家居领域具有明确的应用前景。

数据集最近研究