tp-ont

Hugging Face2026-05-08 更新2026-05-09 收录

下载链接：

https://huggingface.co/datasets/ma25/tp-ont

下载链接

链接失效反馈

官方服务：

资源简介：

TP-ONT是一个用于AI任务规划的结构化本体数据集。该数据集提供两种格式：1) JSON-LD格式，针对Hugging Face的`datasets`库和LLM工作流程进行了优化；2) OWL格式，原始语义源文件，适用于Protégé等OWL兼容工具。数据集包含两个主要文件：`tp-ont.json`（用于数据集查看器的序列化JSON-LD版本）和`tp-ont.owl`（原始OWL/XML源文件）。该数据集由伦敦国王学院的Maayan Armony、Albert Meroño-Peñuela和Gerard Canal创建，版本号为1.0.0，源代码托管在GitHub仓库。数据集适用于本体工程、知识图谱构建和任务规划等应用场景，采用Creative Commons Attribution 4.0 International License许可协议。

TP-ONT is a structured ontology dataset for AI task planning. The dataset is provided in two formats: 1) JSON-LD format, optimized for Hugging Faces `datasets` library and LLM workflows; 2) OWL format, the original semantic source file, suitable for OWL-compatible tools such as Protégé. The dataset contains two main files: `tp-ont.json` (a serialized JSON-LD version for the dataset viewer) and `tp-ont.owl` (the original OWL/XML source file). The dataset was created by Maayan Armony, Albert Meroño-Peñuela, and Gerard Canal from Kings College London, with version number 1.0.0, and the source code is hosted on a GitHub repository. The dataset is suitable for applications such as ontology engineering, knowledge graph construction, and task planning, and is licensed under the Creative Commons Attribution 4.0 International License.

创建时间：

2026-05-08

搜集汇总

数据集介绍

构建方式

该数据集以结构化本体形式呈现，涵盖了人工智能任务规划领域的核心概念与关系。其构建依托于严谨的本体工程方法，原始语义源文件采用OWL/XML格式，适用于Protégé等本体编辑工具。为适配现代机器学习工作流，数据被序列化为JSON-LD格式，便于与Hugging Face数据集库及大语言模型管道无缝集成。数据集由伦敦国王学院的研究团队开发，版本号为1.0.0，源代码托管于公开的GitHub仓库。

使用方法

用户可通过Hugging Face的`load_dataset`函数直接加载该数据集，调用`dataset['train'][0]`即可获取首个JSON-LD条目。建议结合大语言模型进行本体感知的任务规划推理，或将数据导入Protégé进行可视化编辑与一致性校验。对于进阶应用，可参考GitHub仓库中的示例代码，利用其本体结构增强规划算法的可解释性与泛化能力。

背景与挑战

背景概述

TP-ONT数据集由伦敦国王学院的Ma'ayan Armony、Albert Meroño-Peñuela和Gerard Canal于近期创建，旨在以形式化本体（ontology）的形式系统化表达人工智能任务规划（AI Task Planning）领域的核心概念与关系。该数据集以JSON-LD和OWL两种格式发布，兼顾了机器学习工作流与语义网工具的兼容性。作为首个专注于任务规划的结构化本体资源，TP-ONT填补了该领域在知识表示标准化方面的空白，为规划算法的可复用性、知识图谱的构建以及大语言模型对规划知识的理解提供了重要的语义基石，对推动自主智能体、机器人规划等前沿研究方向具有深远影响。

当前挑战

TP-ONT数据集所应对的领域核心挑战在于：任务规划领域长期缺乏统一、机器可读的知识表示标准，导致不同规划系统之间的知识难以共享与互操作，且大语言模型等新兴方法难以有效利用丰富的规划领域知识。在构建过程中，团队面临将非结构化或半结构化的规划文献、教材及专家知识精炼为一套连贯、无冗余且覆盖广泛的OWL本体的挑战，这需要精确界定行动、状态、目标、前提条件等核心实体的层级关系与约束，并确保术语在不同规划范式（如经典规划、时序规划）中的一致性与完备性。

常用场景

经典使用场景

TP-ONT数据集为人工智能任务规划领域提供了一份结构化的本体论知识库，封装于JSON-LD与OWL两种格式之中，便于不同工具链的灵活调用。经典使用场景包括利用大语言模型（LLM）从该本体中提取规划任务的概念体系、关系层级与约束规则，从而辅助机器理解规划问题的语义框架。通过加载该数据集，研究者能够快速获得涵盖规划领域核心实体（如动作、状态、目标）及其逻辑依赖的标准化表示，为后续的推理与决策过程奠定知识基础。

解决学术问题

该数据集主要解决了人工智能任务规划中本体知识缺乏统一、可计算表示的学术困境。传统规划研究长期依赖于领域专属的硬编码规则，难以实现跨场景的知识复用与语义互操作。TP-ONT通过形式化本体建模，将规划领域的抽象概念转化为机器可读的显式结构，从而支持本体对齐、知识图谱补全以及规划问题的语义推理等研究课题。其开源许可与可复用的设计范式，推动了规划本体标准化进程，显著降低了跨系统知识融合的门槛。

实际应用

在实际应用层面，TP-ONT可融入智能制造中的任务调度系统，将操作序列与设备能力映射至本体概念，实现动态调整生产计划。在机器人自主作业场景中，该数据集帮助智能体理解任务目标与动作约束的关系，从而在未知环境中生成合规的规划路径。此外，该本体还可服务于智能助手的人机对话系统，通过语义映射将用户的模糊指令转化为结构化的规划任务，提升响应准确度与执行效率。

数据集最近研究