Isaac-Kitchen-v1119-04

Hugging Face2025-11-21 更新2025-11-22 收录

下载链接：

https://huggingface.co/datasets/exaFLOPs09/Isaac-Kitchen-v1119-04

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人学的数据集，由LeRobot创建。数据集包含50个剧集，共计9423帧，专注于1个任务。数据以.parquet格式存储，并伴有相应的视频文件。数据集提供了丰富的特征，包括厨房编号、子编号、类型、初始姿态、观察状态、动作等，以及相关的视频数据。

创建时间：

2025-11-19

原始信息汇总

Isaac-Kitchen-v1119-04 数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

总情节数: 50
总帧数: 9423
总任务数: 1
数据切块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据分割: 训练集 (0:50)

数据结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

环境信息

kitchen_num: 厨房编号 (int64)
kitchen_sub_num: 厨房子编号 (int64)
kitchen_type: 厨房类型 (int64)
initial_pose: 初始位姿 (float32, 6维)

状态标识

is_first: 首帧标识 (int64)
is_last: 末帧标识 (int64)
subtask_index: 子任务索引 (int64)
task_index: 任务索引 (int64)

观测数据

observation.language: 语言指令 (string)
observation.state: 机器人状态 (float32, 23维)
observation.images.front: 前视图像 (视频, 480×640×3)
observation.images.wrist_left: 左腕图像 (视频, 480×640×3)
observation.images.wrist_right: 右腕图像 (视频, 480×640×3)

动作与控制

action: 机器人动作 (float32, 23维)

索引信息

timestamp: 时间戳 (float32)
frame_index: 帧索引 (int64)
episode_index: 情节索引 (int64)
index: 全局索引 (int64)

技术规格

代码库版本: v3.0
视频编码: H264
像素格式: yuv420p
音频: 无
深度图: 否

搜集汇总

数据集介绍

构建方式

在机器人学习领域，Isaac-Kitchen-v1119-04数据集通过LeRobot框架系统构建，采用分块存储策略将数据组织为50个完整任务片段，总计9423帧观测记录。数据以Parquet格式保存，每1000帧为一个数据块，确保了高效存取与处理。构建过程中整合了多模态传感器输入，包括双视角视觉流与机器人状态参数，为复杂环境下的行为学习提供了结构化基础。

特点

该数据集显著特征在于其丰富的多模态观测维度，涵盖前视与左右腕部三路高清视频流，配合23维机器人关节状态与动作空间。数据以30帧/秒的时序连续性记录，完整保留了任务执行过程中的动态细节。特有的初始位姿标注与语言指令字段，为研究视觉语言导航与机器人操作策略的协同学习创造了理想条件。

使用方法

研究人员可通过加载标准Parquet数据文件直接访问结构化观测-动作对，利用内置的帧索引与分集标识实现时序数据重构。建议采用分块加载机制处理大规模视频流，结合特征字典中明确的维度说明解析多模态信息。该数据集适用于端到端模仿学习、多任务强化学习等范式，其标准化接口确保与主流机器人学习框架的兼容性。

背景与挑战

背景概述

在机器人学习领域，仿真环境数据集对推动具身智能研究具有关键意义。Isaac-Kitchen-v1119-04数据集由HuggingFace的LeRobot项目构建，专为多模态机器人操作任务设计。该数据集通过双机械臂厨房场景记录丰富的传感器数据，包含机器人的状态观测、多视角视觉信息及动作指令，为研究复杂环境下的机器人决策与控制提供了标准化基准。其结构化数据格式与大规模时序轨迹为模仿学习与强化学习算法验证奠定了重要基础。

当前挑战

机器人操作任务需解决高维状态空间下的动作规划难题，该数据集针对动态厨房环境中双机械臂协同操作的精确控制提出挑战。构建过程中面临多传感器时序同步、大规模视频数据存储效率等工程瓶颈，同时需保持动作轨迹与视觉观测的空间一致性。此外，真实物理仿真中的状态噪声与动作延迟也对数据质量提出了严格要求。

常用场景

解决学术问题

该数据集有效解决了机器人模仿学习中样本效率低下的核心问题。通过提供包含语言指令、多模态感知与动作控制的完整交互序列，显著降低了策略学习的探索成本。其精心设计的特征结构支持端到端的行为克隆方法研究，同时为多任务强化学习算法提供了可靠的评估基准，推动了机器人泛化能力与迁移学习的研究进展。

衍生相关工作

围绕该数据集衍生的研究工作主要集中在多模态融合与跨任务迁移方向。部分学者利用其丰富的视觉-语言对数据开发了视觉语言动作模型，实现了自然语言指令到机器人动作的端到端映射。另有研究基于其结构化状态表征探索了分层强化学习框架，显著提升了策略在未见任务上的泛化性能，为机器人终身学习系统的构建提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集