five

emptiness-graph

收藏
Hugging Face2026-05-31 更新2026-06-01 收录
下载链接:
https://huggingface.co/datasets/joyboseroy/emptiness-graph
下载链接
链接失效反馈
官方服务:
资源简介:
Emptiness Graph 是一个关于佛教空性(sunyata)教义的、带类型的哲学知识图谱数据集。该数据集旨在将空性概念作为一种关系结构进行编码和探索,而非一个用于检索的事实。它跨越了上座部佛教、般若经、中观派和瑜伽行派等主要佛教传统,涵盖了从巴利三藏中的‘无我’(anatta)到龙树的中观、寂天的辩证法、瑜伽行派的三性说以及般若经等核心思想。 数据集由两个层次构成:第一层是手工构建的哲学图谱,包含概念节点(concepts)、带注释的哲学关系边(edges)以及源文本元数据(corpus_manifest)。每条关系边都附有解释其存在原因的哲学注释。第二层是自动构建的段落索引,包含从10部源文本中提取的文本段落(passages)以及这些段落与概念之间的提及链接(passage_edges)。 数据集包含五个拆分:concepts(25个哲学概念节点,包含梵文、巴利文、藏文术语)、edges(38条手工标注的带类型哲学关系边)、corpus_manifest(16个源文本的元数据)、passages(1126个来自10部已收录源文本的段落)和passage_edges(416条段落到概念的提及链接)。边关系类型被系统分为四大类共17种,包括本体论关系(如否定、预设、蕴含)、逻辑/辩证法关系(如驳斥、解构)、教义关系(如与…有张力、重构为)和实践关系(如促成、是…的障碍)。 该数据集适用于知识图谱构建与分析、哲学概念关系研究、计算人文学、文本检索以及图机器学习等任务。所有数据均基于公开可用的网络版本、公共领域或开放许可的译本构建。数据集的许可证为混合许可:手工构建的概念、边和语料清单使用CC BY 4.0许可;而自动构建的段落和段落边索引(包含84000项目材料)使用CC BY-NC 4.0许可。

Emptiness Graph is a typed philosophical knowledge graph dataset focused on the doctrine of sunyata (emptiness) in Buddhism. This dataset aims to encode and explore the concept of sunyata as a relational structure, rather than a retrieval-oriented factual resource. It covers major Buddhist traditions including Theravada Buddhism, Prajnaparamita Sutras, Madhyamaka, and Yogacara, and encompasses core ideas ranging from anatta (non-self) in the Pali Canon to Madhyamaka of Nagarjuna, the dialectics of Shantideva, the three natures theory of Yogacara, and the Prajnaparamita Sutras. The dataset consists of two layers: 1. The manually constructed philosophical knowledge graph, which includes concept nodes, annotated philosophical relational edges, and source text metadata (corpus_manifest). Each relational edge is accompanied by philosophical annotations explaining its rationale. 2. The automatically constructed passage index, which contains textual passages extracted from 10 source texts and mention links (passage_edges) between these passages and concepts. The dataset includes five splits: - concepts: 25 philosophical concept nodes, containing Sanskrit, Pali, and Tibetan terminology - edges: 38 manually annotated typed philosophical relational edges - corpus_manifest: metadata for 16 source texts - passages: 1,126 textual passages extracted from 10 included source texts - passage_edges: 416 mention links from passages to concepts Relational edge types are systematically categorized into four major groups totaling 17 types, including ontological relations (e.g., negation, presupposition, entailment), logical/dialectical relations (e.g., refutation, deconstruction), doctrinal relations (e.g., tension with, reconstruction into), and practical relations (e.g., enabling, being an obstacle to). This dataset is applicable to tasks such as knowledge graph construction and analysis, philosophical conceptual relation research, computational humanities, text retrieval, and graph machine learning. All data is constructed based on publicly available web versions, public domain, or openly licensed translations. The dataset uses a mixed licensing scheme: manually constructed concepts, edges, and corpus manifest are licensed under CC BY 4.0; while automatically constructed passages and passage edge indices (including 84000 Project materials) are licensed under CC BY-NC 4.0.
创建时间:
2026-05-30
原始信息汇总

数据集概述:Emptiness Graph

Emptiness Graph 是一个结构化的哲学知识图谱,专注于佛教“空性”(śūnyatā)教义的概念架构,覆盖南传佛教、般若波罗蜜多、中观派和唯识宗等主要传统。该数据集并非用于对话式AI训练,而是将“空性”作为一种可遍历的关系结构进行编码和查询。

数据集构成

数据集包含两个主要层次和五个数据分片:

层1:哲学图谱(手工构建)

  • 包含手工编写的概念、关系和文本元数据,是主要的学术贡献部分。
  • concepts:25个哲学概念节点,包含梵语、巴利语和藏语术语。
  • edges:38条手工标注的关系边,描述概念间的哲学联系,每条边附有解释缘由的注释。
  • corpus_manifest:16条源文本元数据,包括译者、收录状态等信息。

层2:段落索引(自动化生成)

  • 通过脚本从10个源文本中自动提取段落并匹配概念关键词列表生成。
  • passages:1,126条文本段落,来自10个已收录的源文本。
  • passage_edges:416条段落到概念的提及链接。

关系类型(共17种)

关系类型分为四大类:

  • 本体论:否定、预设、蕴含、等同、外延相同、依赖、基础
  • 逻辑/辩证法:反驳、扩展、运用方法、解构
  • 教义学:张力、重构为、常规表达、究竟层次、先驱
  • 实践:促成、障碍、对治

概念节点列表(25个)

  • 自性、空性、无我、人无我、法无我
  • 缘起、二谛、南传二谛、归谬论证
  • 假名、空之空性、阿赖耶识、三自性、如来藏
  • 五蕴、十二缘起、法界、不二、方便
  • 断见极端、常见极端、阿毗达磨实在论、唯识、菩提心、三身

已收录的源文本(共10篇,计划16篇)

文本名称 译者 段落数
无我相经 苏迦多比丘 20
弥兰陀王问经(车喻) 里斯·戴维斯 23
心经 宁玛蒙古/多译本 90
金刚经 公共领域 30
八千颂般若波罗蜜多经 84000 119
维摩诘经(第9品) 罗伯特·瑟曼 41
解深密经 84000 570
中论(第1,18,22,23,24,26章) 格西·格桑旺姆 120
七十空性论 林多 73
入菩萨行论(第9品) 莲师翻译组 40

许可信息

  • concepts, edges, corpus_manifest:采用 CC BY 4.0 许可
  • passages, passage_edges:采用 CC BY-NC 4.0 许可(因包含84000提供的材料)

数据统计

分片 记录数
concepts 25
edges 38
corpus_manifest 16
passages 1,126
passage_edges 416

引用格式

bibtex @dataset{bose2026emptiness, title = {Emptiness Graph: A Typed Philosophical Knowledge Graph of Buddhist Sunyata}, author = {Bose, Joy}, year = {2026}, url = {https://huggingface.co/datasets/joyboseroy/emptiness-graph}, note = {Hand-authored concept graph and automated passage index spanning Theravada, Prajnaparamita, Madhyamaka, and Yogacara} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过双重分层架构构建,旨在编码佛教空性教义的哲学体系。第一层为手工编纂的哲学知识图谱,涵盖25个核心概念节点(如svabhava、sunyata、pratityasamutpada)及38条带有详尽注释的哲学关系边。每条边均包含`notes`字段,阐释关系存在的哲学依据,构成数据集的主要学术贡献。第二层为自动化生成的文本索引,通过`build_passage_index.py`脚本从10部公开可用的佛经文本中提取1126个段落,并依据预定义概念关键词列表建立段落与概念的关联,生成416条段落-概念边。此外,16条语料清单元数据记录了各文本的翻译者及收录状态,确保来源透明。
使用方法
数据集可通过HuggingFace Datasets库便捷加载,并支持与NetworkX等图分析工具集成。用户可调用`load_dataset`获取所有子集,通过构建有向多重图实现哲学关系的可视化与查询。例如,可查询某部经典(如《心经》)所驳斥的概念,或追踪某一思想(如空性)在不同传统中的前驱与等价表述。段落与概念的关联边使研究者能快速定位特定哲学术语在原始文本中的出处,便于学术溯源与比较研究。数据集以CC BY 4.0及CC BY-NC 4.0许可发布,鼓励非商业性学术再创作,并提供了标准BibTeX引用格式。
背景与挑战
背景概述
Emptiness Graph 是由研究者 Joy Bose 于 2026 年创建的一个类型化哲学知识图谱,专注于佛教空性(śūnyatā)教义的结构化表征。该数据集由 Hugging Face 平台发布,旨在超越传统文本检索模式,将空性作为关系网络而非孤立事实进行建模。其核心研究问题在于如何通过图结构捕捉上座部、般若波罗蜜多、中观派与唯识宗等传统中关于无我、缘起、二谛、三性等核心概念的哲学关联。通过手工编纂的25个概念节点与38条哲学关系边,辅以10部经典文本的1126条段落索引,该数据集为人文学科的计算研究提供了可查询的语义架构,推动了数字人文与知识图谱在东亚哲学领域的交叉应用。
当前挑战
Emptiness Graph 所应对的领域挑战在于,佛教空性哲学本质上是高度关系性的(如龙树的缘起论证),而传统数据集仅支持扁平化的事实检索,无法呈现概念间的否定、预设、等同、衍变等复杂性。其构建过程亦面临多重挑战:手工编纂哲学关系时需确保跨传统术语对齐(如“无我”在巴利藏与中观中的不同内涵),同时兼顾注疏的学术严谨性;自动段落索引依赖关键词匹配,易遗漏隐含的哲学指涉,且部分关键文本(计划16部中仅完成10部)的翻译版本与开放许可限制增加了语料覆盖的难度。此外,区分表义层次(世俗谛与胜义谛)并避免误读为虚无主义,要求知识图谱的推理路径需内嵌注释性哲学说明,对图模型的逻辑表达能力构成设计与验证的双重考验。
常用场景
经典使用场景
Emptiness Graph作为一个结构化的哲学知识图谱,其经典使用场景在于通过图形化方式表达佛教空性教义的概念体系与逻辑关系。研究人员可借助该数据集中的25个核心概念节点和38条手动标注的哲学关系边,构建从巴利文经典中anatta到中观派空性、唯识宗三性等学说的依存网络。典型应用包括遍历空性概念的蕴含路径、追溯不同传统之间教义的张力与融合,以及通过查询特定文本段落来解析诸如龙树对缘起性空论证的逻辑结构,为跨流派佛教哲学的比较研究提供了可计算的语义基底。
解决学术问题
该数据集有效回应了计算人文学科中一个长期存在的挑战——如何将高度抽象且依赖语境的哲学教义转化为可操作的符号表示。它消解了传统上仅依赖文本检索的空性研究范式,通过将语义依存关系显式化为17种类型边的图结构,使学者能够系统性地分析空性概念在不同佛教传统中的演变脉络。这一构建不仅厘清了中观派与唯识派在空性理解上的异同,还揭示了从早期佛教无我论到晚期如来藏思想之间逻辑桥梁的断裂与延续,为佛教哲学的形式化与数字化存档开辟了新路径。
实际应用
在实际应用层面,Emptiness Graph可被部署于智能知识检索系统与数字人文教学平台中。佛教研究者或哲学课程开发者可利用该图数据集开展主题检索,例如快速定位某部经典中提及"空性之空性"概念的具体段落;图书馆与博物馆可采用其作为连接经典文本与概念词典的元数据骨架,辅助数字化馆藏的语义标注。此外,该数据集亦可支持对话式哲学探索工具的开发,通过可视化遍历概念关系图,帮助学习者直观理解复杂教义间的推理与反驳链条,降低东方哲学传播的认知壁垒。
数据集最近研究
最新研究方向
该数据集开创性地将佛教空性哲学构建为结构化知识图谱,融合了上座部、般若中观、唯识等传统对'空性'的多元诠释。其前沿方向在于通过图关系建模哲学概念间的辩证、依存与张力,如将龙树的缘起论证转化为依赖关系网络,使'空性'从静态教义跃升为可遍历的关系结构。这一方法在计算人文学科中呼应了知识图谱与东方哲学对话的热潮,尤其为跨文本、跨传统的概念比较提供了可查询的定量框架。其影响在于弥合了佛学经典与自然语言处理之间的鸿沟,为语义检索、概念推理及哲学文本的自动分析开辟了新路径,推动了对空性逻辑结构的数字化理解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作