five

Isaac-Kitchen-v1103-00

收藏
Hugging Face2025-11-24 更新2025-11-25 收录
下载链接:
https://huggingface.co/datasets/exaFLOPs09/Isaac-Kitchen-v1103-00
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于机器人操作的 dataset,包含了100个 episodes,每个episode包含不同数量的frames。数据集提供了初始姿态、是否为第一个或最后一个frame的信息,以及机器手的动作。此外,还包括了前视摄像头和两个手腕摄像头捕捉的图像信息。数据集的结构化数据以Parquet格式存储,视频文件为MP4格式。
创建时间:
2025-11-16
原始信息汇总

Isaac-Kitchen-v1103-00 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot

数据集规模

  • 总情节数: 100
  • 总帧数: 73024
  • 总任务数: 1
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 30 FPS
  • 数据分块大小: 1000
  • 代码库版本: v3.0

数据划分

  • 训练集: 0:100(全部数据)

数据结构

数据文件路径

  • 数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

环境信息

  • kitchen_num: 厨房编号(int64)
  • kitchen_sub_num: 厨房子编号(int64)
  • kitchen_type: 厨房类型(int64)

状态标识

  • initial_pose: 初始位姿(float32,6维:[x, y, qw, qx, qy, qz])
  • is_first: 首帧标识(int64)
  • is_last: 末帧标识(int64)
  • subtask_index: 子任务索引(int64)

观测数据

  • observation.language: 语言指令(string)
  • observation.state: 状态观测(float32,23维:[l_x, l_y, l_z, l_r1-l_r6, r_x, r_y, r_z, r_r1-r_r6, l_gripper, r_gripper, v_x, v_y, omega])

视觉观测

  • observation.images.front: 前视图像(视频,480×640×3,H.264编码)
  • observation.images.wrist_left: 左腕图像(视频,480×640×3,H.264编码)
  • observation.images.wrist_right: 右腕图像(视频,480×640×3,H.264编码)

动作与控制

  • action: 动作指令(float32,23维,与状态观测维度对应)

索引信息

  • timestamp: 时间戳(float32)
  • frame_index: 帧索引(int64)
  • episode_index: 情节索引(int64)
  • index: 数据索引(int64)
  • task_index: 任务索引(int64)

视频规格

  • 分辨率: 640×480
  • 色彩空间: YUV420p
  • 编码格式: H.264
  • 帧率: 30 FPS
  • 音频: 无
  • 深度图: 否
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,数据集的构建质量直接影响模型性能。Isaac-Kitchen-v1103-00通过LeRobot平台系统采集了100个完整任务片段,以30帧/秒的速率记录多模态数据。数据以分块存储的Parquet格式组织,每块包含1000帧观测记录,同时配备同步视频流。该构建方法通过标准化流程确保了时空一致性,为模仿学习提供了结构化基础。
使用方法
研究者可通过加载Parquet数据文件直接访问结构化观测-动作对,利用帧索引实现时序对齐。视频数据与状态数据通过统一时间戳保持同步,支持联合训练视觉-动作映射模型。数据集已预划分为训练集,可直接用于行为克隆、强化学习等算法验证,其标准化接口确保与主流机器人学习框架的兼容性。
背景与挑战
背景概述
在机器人学习领域,模拟环境数据集对于推进自主操作系统的研究具有关键意义。Isaac-Kitchen-v1103-00数据集由HuggingFace的LeRobot项目构建,专注于厨房场景下的机器人任务学习。该数据集通过整合多模态传感器数据,包括双机械臂状态、视觉观测和语言指令,旨在解决复杂环境中的机器人动作规划与执行问题。其结构化设计支持大规模模仿学习与强化学习算法的训练,为家庭服务机器人的智能化发展提供了重要数据基础。
当前挑战
该数据集致力于应对机器人操作任务中的高维状态空间建模挑战,需从异构传感器流中提取有效特征以实现精确的动作预测。构建过程中面临多源数据同步与校准的复杂性,例如协调视觉视频流与机械臂姿态数据的时间一致性。同时,数据采集需保证场景多样性与任务覆盖度,以克服现实环境中物体交互的动态不确定性,这对数据集的规模与质量提出了严格要求。
常用场景
经典使用场景
在机器人操作学习领域,Isaac-Kitchen-v1103-00数据集通过多视角视觉感知与双机械臂状态数据,为模仿学习算法提供了丰富的训练素材。其包含的73024帧厨房环境交互记录,结合语言指令与动作轨迹,能够有效支撑端到端策略网络的训练过程,尤其在复杂任务分解与动态环境适应方面展现出独特价值。
解决学术问题
该数据集通过结构化存储的机器人状态空间与动作空间数据,解决了传统强化学习中样本效率低下的核心难题。其提供的23维状态特征与对应动作向量,为研究连续控制中的动力学建模、多模态感知融合等关键问题建立了基准,显著推动了具身智能在非结构化环境中的泛化能力研究。
实际应用
基于该数据集训练的模型可直接迁移至真实厨房场景,实现餐具整理、食材处理等日常任务。其包含的左右机械臂协同操作数据,为服务机器人精准抓取、力控交互等实际需求提供了技术验证平台,尤其在老年辅助与智能家居领域具有明确的应用前景。
数据集最近研究
最新研究方向
在机器人操作学习领域,Isaac-Kitchen-v1103-00数据集凭借其多模态特征正推动着具身智能的前沿探索。该数据集整合了双视角视觉感知、23维状态观测与动作空间,为模仿学习与强化学习算法提供了丰富的厨房场景交互数据。当前研究聚焦于跨模态表征对齐技术,通过语言指令引导的序列任务学习,显著提升了机器人对复杂操作任务的泛化能力。随着端到端决策模型的兴起,这类高精度时序数据正成为解决动态环境适应性与长期规划挑战的关键基石,为家庭服务机器人的实用化部署奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作