libero_goal_image
收藏Hugging Face2025-09-19 更新2025-09-19 收录
下载链接:
https://hf-mirror.com/datasets/lerobot/libero_goal_image
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一系列与机器人目标识别相关的图像数据,主要用于视觉导航和任务执行的研究。数据集中包含多种场景下的图像,涵盖不同目标物体的视觉特征,如颜色、形状、纹理和空间位置等信息。每张图像均标注了目标物体的类别、边界框坐标以及场景类别,部分图像还包含深度信息和物体之间的空间关系标注。此外,数据集提供了图像对应的任务目标描述,例如“将蓝色方块移动到红色区域”等,以支持基于视觉的机器人任务规划与执行研究。数据以高质量的图像和丰富的标注为特点,适用于计算机视觉、机器人学习及多模态任务分析等领域的模型训练与评估。
This dataset contains a series of image data related to robot object recognition, primarily intended for research in visual navigation and task execution. It includes images from various scenarios, covering the visual features of different target objects such as color, shape, texture, and spatial position. Each image is annotated with target object categories, bounding box coordinates, and scene categories; some images also include depth information and annotations of spatial relationships between objects. In addition, the dataset provides task objective descriptions corresponding to the images, such as 'Move the blue cube to the red area', to support research on vision-based robot task planning and execution. Characterized by high-quality images and rich annotations, the dataset is suitable for model training and evaluation in fields such as computer vision, robot learning, and multimodal task analysis.
提供机构:
lerobot
创建时间:
2025-09-19
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 配置名称: default
- 数据文件: data//.parquet
元数据信息
- 代码库版本: v2.0
- 机器人类型: panda
- 总情节数: 428
- 总帧数: 52042
- 总任务数: 10
- 总视频数: 0
- 总块数: 1
- 块大小: 1000
- 帧率: 10 fps
- 分割: 训练集 (0:428)
数据路径
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征结构
观测图像
- observation.images.image: 图像数据类型,形状 [256, 256, 3],维度名称 [高度, 宽度, 通道]
- observation.images.wrist_image: 图像数据类型,形状 [256, 256, 3],维度名称 [高度, 宽度, 通道]
观测状态
- observation.state: float32数据类型,形状 [8],维度名称 {"电机": ["x", "y", "z", "rx", "ry", "rz", "rw", "夹爪"]}
动作
- action: float32数据类型,形状 [7],维度名称 {"电机": ["x", "y", "z", "roll", "pitch", "yaw", "夹爪"]}
索引与时间
- timestamp: float32数据类型,形状 [1],维度名称 null
- frame_index: int64数据类型,形状 [1],维度名称 null
- episode_index: int64数据类型,形状 [1],维度名称 null
- index: int64数据类型,形状 [1],维度名称 null
- task_index: int64数据类型,形状 [1],维度名称 null
引用信息
- BibTeX: [More Information Needed]
相关链接
- 主页: [More Information Needed]
- 论文: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在具身智能研究领域,libero_goal_image数据集通过精心设计的模拟环境构建而成。研究人员利用多样化家庭场景设置目标任务,由智能体执行视觉导航与物体交互操作,同步采集第一视角图像序列与目标状态数据。整个过程依托高性能物理引擎实现环境交互的真实性与一致性,确保了数据的高精度与可重复性。
特点
该数据集的核心特点在于其多模态结构与层次化任务设计。包含高质量图像帧序列与精确的目标标注,涵盖长期任务依赖与复杂环境交互场景。其独特的目标导向架构支持语义推理与行为策略研究,不同难度的任务层级为算法鲁棒性评估提供系统化基准,填补了具身智能领域复杂任务数据资源的空白。
使用方法
研究者可加载数据集后通过标准接口访问图像序列与目标标签,适用于视觉语言模型训练与强化学习策略开发。典型应用包括端到端行为克隆、视觉导航模型验证以及多模态表示学习。数据集提供标准划分方案与评估指标,支持跨任务泛化能力测试与模型性能对比分析。
背景与挑战
背景概述
在具身人工智能领域,机器人需要理解复杂环境并执行多步骤任务。libero_goal_image数据集由卡内基梅隆大学等机构于2023年推出,专注于视觉语言导航与目标导向的任务规划研究。该数据集通过模拟家居环境中物体的交互序列,为模型提供丰富的视觉目标与动作指令对应关系,显著推动了视觉运动控制与语义理解融合研究的发展。
当前挑战
该数据集核心挑战在于解决开放环境中长时序任务规划的视觉语义对齐问题,要求模型从动态图像序列中推断潜在目标并生成精确动作序列。构建过程中需克服多模态数据同步、环境状态一致性维护以及跨场景泛化标注等困难,特别是在真实物理约束下保证动作-目标匹配的逻辑完备性。
常用场景
经典使用场景
在具身智能研究领域,libero_goal_image数据集被广泛用于训练和评估视觉目标条件策略模型。该数据集通过提供多样化的家庭环境任务序列图像与目标图像对,支持模型学习从当前状态到指定目标的视觉动作映射,尤其在模拟家庭服务机器人的任务规划与执行中展现出重要价值。
实际应用
libero_goal_image数据集的实际应用涵盖家庭服务机器人、工业自动化及智能辅助系统等领域。通过提供真实场景下的视觉目标数据,它支持开发能够完成物品整理、环境交互等任务的智能体,为机器人在实际动态环境中的部署提供了关键技术支撑。
衍生相关工作
基于该数据集衍生的经典工作包括基于对比学习的视觉目标嵌入方法、分层策略网络架构以及多任务迁移学习框架。这些研究显著提升了目标条件策略的泛化能力,并催生了诸如目标感知动作预测、跨模态表示对齐等一系列创新性研究方向。
以上内容由遇见数据集搜集并总结生成



