image-hddl-dataset

Hugging Face2025-07-15 更新2025-07-16 收录

下载链接：

https://huggingface.co/datasets/shuooru/image-hddl-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含RGB图像及其对应规划问题定义（使用PDDL或HDDL语言编写）的数据集，旨在用于视觉符号推理、任务定位和神经符号规划等研究领域。

This is a dataset containing RGB images and their corresponding planning problem definitions (written in either PDDL or HDDL), which is intended for research areas including visual symbolic reasoning, task grounding, and neuro-symbolic planning.

创建时间：

2025-07-09

原始信息汇总

🧠 Image–PDDL Dataset for Visual Symbolic Planning 数据集概述

📌 数据集基本信息

数据集名称: Image–PDDL Dataset for Visual Symbolic Planning
数据集用途: 视觉符号推理、任务基础、神经符号规划
数据格式: 图像与PDDL/HDDL格式的符号任务描述配对
下载大小: 136615772字节
数据集大小: 196535114字节
示例数量: 185个

📁 数据集结构

特征:
- image: RGB图像（PIL.Image格式）
- hddl: PDDL或HDDL格式的符号任务描述字符串
示例结构: json { "image": "images/0001.jpg", "hddl": "(define (problem clean-room-01) ... )" }

📊 数据集拆分

训练集:
- 样本数量: 185
- 字节大小: 196535114.0

🔗 相关链接

PDDL介绍: Planning Domain Definition Language

搜集汇总

数据集介绍

构建方式

在视觉符号推理领域，image-hddl-dataset的构建采用了严谨的数据采集与标注流程。研究团队通过精心设计的实验场景生成185组RGB图像，每幅图像均对应人工标注的PDDL或HDDL格式任务描述文本。数据存储采用分布式文件结构，原始图像以二进制格式保存，确保视觉信息的完整性；符号描述则经过标准化校验，保证语法结构的准确性。数据集采用单训练集划分方式，总容量达196MB，实现了视觉输入与符号输出的精确对齐。

特点

该数据集的核心价值在于其跨模态特性，实现了视觉场景与符号化规划的深度融合。每对数据包含高分辨率RGB图像和结构化PDDL/HDDL描述，形成视觉-符号双通道表征。特别值得注意的是，所有规划问题定义均遵循国际计划语言标准，支持复杂任务的条件表达与动作序列描述。185个样本覆盖多样化场景，数据体积与样本量经过科学配比，在保证模型训练需求的同时避免了冗余存储。

使用方法

针对神经符号规划研究需求，该数据集推荐端到端的使用范式。研究者可通过标准接口加载图像-文本对，直接输入多模态学习框架进行联合表征训练。图像数据支持主流计算机视觉库解析，符号描述兼容PDDL解析器处理。典型应用场景包括：将视觉特征映射为符号谓词的任务接地研究、基于图像输入的自动规划系统开发、以及验证神经符号模型的推理能力。使用时应注重保持原始数据对的结构对应关系，建议采用批处理方式优化内存使用。

背景与挑战

背景概述

image-hddl-dataset数据集由专注于人工智能规划的科研团队于近年创建，旨在推动视觉符号推理与神经符号规划领域的研究。该数据集的核心研究问题聚焦于如何将视觉信息与符号化任务描述有效结合，通过PDDL（规划领域定义语言）实现复杂场景的任务规划。作为跨模态研究的代表性数据资源，其通过185组高质量图像-PDDL配对样本，为视觉基础规划、任务接地等前沿方向提供了基准测试平台，显著促进了认知智能领域的发展。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，需解决视觉场景到符号化描述的精确映射难题，包括物体关系推理、动态环境建模等复杂认知任务；在构建过程中，遭遇多模态数据对齐的工程挑战，如确保PDDL语法严谨性的同时保持图像语义的完整表达，以及处理小样本条件下符号化标注的高专业门槛问题。这些挑战使该数据集成为测试跨模态表示学习算法鲁棒性的重要试金石。

常用场景

经典使用场景

在视觉符号推理领域，image-hddl-dataset数据集通过结合RGB图像与对应的PDDL规划问题定义，为研究者提供了研究视觉场景与符号规划之间映射关系的理想平台。该数据集广泛应用于视觉任务基础研究，特别是在需要将视觉输入转化为可执行规划任务的场景中，例如机器人任务规划和自动化决策系统。

衍生相关工作

围绕image-hddl-dataset数据集，研究者们已开展多项重要工作。其中包括基于深度学习的视觉符号转换模型、神经符号规划系统的性能评估框架，以及跨模态表示学习方法。这些工作不仅扩展了数据集的应用范围，也为视觉与符号推理的融合提供了新的研究方向。

数据集最近研究