five

Repository of Ontology Competency QuestionS (ROCQS)

收藏
arXiv2024-12-18 更新2024-12-25 收录
下载链接:
http://arxiv.org/abs/2412.13688v1
下载链接
链接失效反馈
官方服务:
资源简介:
ROCQS数据集是由开普敦大学计算机科学系和南非科学和工业研究委员会创建的,旨在为本体开发中的能力问题(CQs)提供一个注释库。该数据集包含438个CQs,涵盖了五种主要类型的CQs,包括范围界定(SCQ)、验证(VCQ)、基础(FCQ)、关系(RCQ)和元属性(MpCQ)问题。数据集的创建过程结合了现有的CQs数据集和新的CQs及模板,旨在通过分类和标注CQs的关键组成部分,促进本体开发中的使用和研究。该数据集主要应用于本体工程领域,旨在解决本体开发中能力问题的模糊性和不可用性问题,提升本体开发的有效性。

The ROCQS Dataset was developed by the Department of Computer Science at the University of Cape Town and the Council for Scientific and Industrial Research of South Africa, with the goal of providing an annotated repository for competency questions (CQs) in ontology development. This dataset contains 438 CQs, covering five primary categories of competency questions: scoping competency questions (SCQ), validation competency questions (VCQ), foundational competency questions (FCQ), relational competency questions (RCQ), and meta-property competency questions (MpCQ). The construction of the dataset integrates existing CQ datasets, newly compiled CQs and templates, aiming to facilitate the application and research in ontology development by classifying and annotating the core components of CQs. Primarily utilized in the field of ontology engineering, this dataset is designed to resolve the problems of ambiguity and unavailability of competency questions during ontology development, thereby enhancing the effectiveness of ontology development.
提供机构:
开普敦大学计算机科学系,南非
创建时间:
2024-12-18
搜集汇总
数据集介绍
main_image_url
构建方式
ROCQS数据集的构建基于对现有能力问题(CQs)的分析与扩展,结合了已有CQ数据集和新生成的CQs及其模板。研究团队首先通过文献调研和实际案例分析,识别出CQs在本体开发中的不同用途,并将其分类为五种主要类型:范围界定(SCQ)、验证(VCQ)、基础对齐(FCQ)、关系分析(RCQ)和元属性(MpCQ)问题。随后,团队通过设计模板和生成新的CQs,补充了现有数据集中缺失的类型,最终构建了一个包含438个CQs的注释库。该库遵循FAIR原则,确保数据的可查找性、可访问性、互操作性和可重用性。
特点
ROCQS数据集的特点在于其系统性和多样性。首先,数据集涵盖了五种不同类型的CQs,每种类型都有其独特的目的和构成要素,能够满足本体开发中的不同需求。其次,数据集不仅包含了现有的CQs,还通过设计模板和生成新的CQs,补充了基础对齐、关系分析和元属性等较少见的类型。此外,数据集中的每个CQ都与其评估的本体相关联,提供了上下文信息,便于用户理解和使用。最后,数据集遵循FAIR原则,确保了其在不同研究场景中的广泛适用性。
使用方法
ROCQS数据集的使用方法多样,适用于本体开发的不同阶段。首先,用户可以通过数据集中的CQs进行本体范围界定和内容验证,确保本体的准确性和完整性。其次,数据集中的基础对齐CQs可用于将领域本体与基础本体对齐,增强语义互操作性。关系分析CQs则帮助用户分析本体中关系的关键特性,如关系的传递性和参与者的数量。元属性CQs则用于对实体进行分类,基于其持久性和存在特性。此外,用户还可以通过数据集中的模板生成新的CQs,以满足特定领域的需求。数据集的可编辑性也为用户提供了进一步扩展和优化的空间。
背景与挑战
背景概述
Repository of Ontology Competency QuestionS (ROCQS) 数据集由C. Maria Keet和Zubeida Casmod Khan于2024年创建,旨在解决本体开发中的能力问题(Competency Questions, CQs)的模糊性和不可用性问题。CQs在本体开发中广泛用于指导范围界定和验证阶段,但现有的CQs缺乏明确的指导和评估标准,导致其在实际应用中存在诸多问题。ROCQS数据集包含438个CQs,涵盖了五种主要类型:范围界定问题(SCQ)、验证问题(VCQ)、基础问题(FCQ)、关系问题(RCQ)和元属性问题(MpCQ)。该数据集通过提供清晰的CQs分类和模板,旨在提高CQs在本体开发中的有效性,并为相关研究提供支持。
当前挑战
ROCQS数据集面临的挑战主要包括两个方面。首先,CQs在本体开发中的应用存在模糊性和不一致性,导致其在实际使用中难以系统化。现有的本体开发方法缺乏对CQs的明确指导和建模技术,使得开发者在制定CQs时面临困难。其次,构建ROCQS数据集的过程中,研究人员需要克服CQs的多样性和复杂性,确保每种类型的CQs都能清晰地区分并适用于不同的本体开发任务。此外,CQs的正式化和可回答性也是一个重要挑战,特别是在逻辑或查询语言的表达能力和内容覆盖范围有限的情况下,如何确保CQs的准确性和有效性仍需进一步研究。
常用场景
经典使用场景
ROCQS数据集在本体工程领域中被广泛用于指导本体的开发和验证。通过提供五种主要类型的胜任力问题(CQs),包括范围界定问题(SCQ)、验证问题(VCQ)、基础问题(FCQ)、关系问题(RCQ)和元属性问题(MpCQ),ROCQS帮助本体工程师在不同开发阶段明确问题的类型和目的。例如,SCQ用于界定本体的主题范围,VCQ用于验证本体内容的准确性,FCQ用于将领域实体与基础本体对齐,RCQ用于分析关系的关键特性,MpCQ则用于分类实体的持久性和存在特性。
解决学术问题
ROCQS数据集解决了本体工程中胜任力问题(CQs)的模糊性和不可用性问题。通过提供清晰的分类和模板,ROCQS帮助本体工程师系统地制定和评估CQs,从而避免了因问题表述不清或不可形式化而导致的本体开发障碍。此外,ROCQS还为本体开发提供了理论支持,帮助研究者更好地理解CQs的构成要素及其在本体开发中的不同作用,提升了本体开发的效率和准确性。
衍生相关工作
ROCQS数据集衍生了一系列相关研究工作,特别是在自动化生成和评估胜任力问题(CQs)方面。例如,基于ROCQS的分类和模板,研究者开发了自动化工具AgoQQs,用于生成CQs并评估其质量。此外,ROCQS还促进了CQs在自然语言处理(NLP)系统中的应用,帮助改进语言本体的开发和评估。这些衍生工作不仅扩展了ROCQS的应用范围,还推动了本体工程领域的理论和技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作