ChronoMedKG

Name: ChronoMedKG
Creator: 南丹麦大学; 汉堡大学
Published: 2026-05-22 01:04:28
License: 暂无描述

arXiv2026-05-22 更新2026-05-23 收录

下载链接：

https://doi.org/10.5281/zenodo.19697542

下载链接

链接失效反馈

官方服务：

资源简介：

ChronoMedKG是由南丹麦大学和汉堡大学联合创建的时间基础生物医学知识图谱，旨在解决现有生物医学知识图谱缺乏时间维度的问题。该数据集包含460,497条经过验证的三元组，覆盖13,431种疾病，每条关联均包含发病窗口、进展阶段等时间成分，并附有PMID可追溯证据和多信号可信度评分。数据集通过疾病自主的多智能体流水线构建，利用前沿大语言模型从PubMed和PMC文献中独立提取知识，仅保留多模型共识、通过可信度筛选和本体对齐的关系。该数据集主要应用于临床推理领域，特别是纵向临床决策支持，能够为检索增强的临床系统提供关键的时间轴信息，帮助解决疾病表型何时出现等时间敏感的临床问题。

ChronoMedKG is a temporally grounded biomedical knowledge graph jointly developed by the University of Southern Denmark and the University of Hamburg, designed to address the critical gap where existing biomedical knowledge graphs lack temporal dimensions. This dataset encompasses 460,497 validated triples spanning 13,431 distinct diseases, with each association incorporating temporal components such as disease onset window and progression stage, accompanied by traceable PMID evidence and multi-signal credibility scores. Constructed via a disease-autonomous multi-agent pipeline, the dataset leverages state-of-the-art large language models (LLMs) to independently extract knowledge from PubMed and PMC literature, and only retains relationships that meet multi-model consensus, have passed credibility filtering, and undergone ontology alignment. This dataset is primarily utilized in the field of clinical reasoning, particularly for longitudinal clinical decision support. It can provide key timeline information for retrieval-augmented clinical systems, assisting in resolving time-sensitive clinical inquiries such as the timing of disease phenotype emergence.

提供机构：

南丹麦大学; 汉堡大学

创建时间：

2026-05-22

原始信息汇总

数据集概述

数据集名称：ChronoMedKG: A Temporally-Grounded, Evidence-Graded Biomedical Knowledge Graph and Benchmark for Temporal Clinical Reasoning
版本：0.0.1
DOI：10.5281/zenodo.19697542（所有版本的DOI）
发布者：Zenodo
语言：英语
资源类型：Dataset
许可证：Creative Commons Attribution 4.0 International

核心内容

ChronoMedKG是一个基于时间维度、经过证据分级的生物医学知识图谱，旨在支持时间性临床推理。其构建过程如下：

采用一个四智能体疾病自主流水线（Disease Profiler, Evidence Harvester, Knowledge Extractor, Quality Controller），覆盖了PrimeKG 17,080种疾病中的13,431种（约78.6%）。
从约1300万个提取的三元组中，经过多LLM共识和质量控制过滤，最终得到460,497个经过验证的共识三元组，涉及10,852种疾病。
每条边（关系）均附带时间元数据（每个表型的发病窗口、进展阶段、临床里程碑）、可追溯到PMID的证据文本，以及一个六信号可信度评分。

关键特性

时间维度：区别于PrimeKG、iKraph、Hetionet等静态知识图谱，ChronoMedKG记录了每个事实在疾病病程中适用的时间点。
新增数据：为6,250种疾病添加了发病数据，这些数据在现有参考资源（HPOA, Orphadata, Phenopackets）中不存在；其中1,657种是Orphanet编码的罕见病，首次获得结构化发病表示。
验证结果：与Orphadata的验证一致性达92.7%；对100种新增覆盖疾病的三LLM评判小组审计一致性达87.9%。

配套基准测试

数据集同时包含ChronoTQA，这是第一个时间性生物医学QA基准测试：

共有3,341个问题，涵盖8种报告任务类型及一个12题的HPOA负向时间性MCQ补充测试。
前沿LLMs在时间性项目上的准确率比静态问题低约30个百分点。
利用ChronoMedKG进行选择性检索，可以挽救47-65%的长尾失败查询（相比之下，HPOA-RAG仅能挽救17-29%）。

文件清单

文件名	描述	大小
validated_triples.jsonl	黄金标准，经质量控制的主产品	527 MB
consensus_triples.jsonl.gz	银标准，质量控制前的共识三元组	29.6 MB
raw_triples.jsonl.gz	青铜标准，完整提取日志（1300万行）	644 MB
tqa_benchmark.json	ChronoTQA基准测试	3.2 MB
pmc_clinical_cases.json	31个诊断难题病例报告	63.5 kB
novelty_multi_judge_v2.json	三LLM评判结果	168 kB
croissant.json	Croissant 1.0机器学习元数据	14.0 kB
README.md	说明文档	10.7 kB
LICENSE-DATA	数据许可证	3.3 kB
NOTICE	通知文件	1.1 kB

构建成本

在13,431种疾病上的总构建成本（LLM API开销）约为2,400美元。

关键词

temporal knowledge graph, benchmark, temporal reasoning, biomedical knowledge graph, agentic pipeline, LLM extraction, ChronoMedKG, ChronoTQA, knowledge graph completion, retrieval-augmented generation

MeSH主题

Rare Diseases

引用格式

Ahmed, M. S., Firoozbakht, F., Galke Poech, L., Baumbach, J., & Röttger, R. (2026). ChronoMedKG: A Temporally-Grounded, Evidence-Graded Biomedical Knowledge Graph and Benchmark for Temporal Clinical Reasoning (0.0.1) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.19697543

搜集汇总

数据集介绍

构建方式

ChronoMedKG的构建基于一个疾病自主的多智能体流水线，该流水线由四个协作代理组成，无需针对每种疾病的手动编码或提示工程。给定一个疾病标识符后，疾病分析器首先查询生物医学本体以生成元数据。随后，证据收集器从PubMed和PMC中检索相关文献。知识提取器利用多个前沿大语言模型并行处理文档，仅当至少两个模型独立提取出相同三元组且实体模糊匹配度达到80%以上时，该候选关系才被保留。最后，质量控制代理对齐实体至PrimeKG模式，应用时间合理性约束，并计算包含六项信号的可信度评分。从约1300万原始提取中，最终获得了460,497个经过验证的共识三元组，覆盖13,431种疾病，每个关系均附带PMID可追溯的证据和逐字引文。

特点

ChronoMedKG的核心特征在于其为生物医学知识图谱引入了精细的时间维度。每个三元组都包含三种形式的时间元数据：发病年龄范围、进展阶段或临床里程碑，这使其能够区分不同疾病阶段的表现。与现有知识图谱不同，该资源提供了边级别的证据溯源，包括100%的PMID引用和99.9%的支撑引文，确保了信息的可验证性。此外，其采用的多模型共识机制和六信号可信度评分显著提升了提取关系的可靠性。该图谱在Orphadata上达到了92.7%的有效准确率，并为6250种此前缺乏任何结构化时间数据的疾病提供了首次时间信息标注，其中包括1657种孤儿病编码的罕见疾病。

使用方法

ChronoMedKG可作为时间感知的检索增强生成系统的知识库，用于提升大语言模型在临床时间推理任务中的表现。研究者可直接下载JSONL格式的三元组文件，利用其时间字段进行疾病表型时间轨迹的聚类分析、发病年龄覆盖范围的缺口研究，或作为链接预测实验的监督信号。该资源还支持基于PMID对原始证据进行直接验证。同时，伴随发布的ChronoTQA基准测试提供了3341个涵盖八种任务类型的问题，可用于评估模型在处理时间条件化临床问题时的性能。代码和数据集均以开源形式发布，便于社区复现、审计和扩展。

背景与挑战

背景概述

ChronoMedKG是由南丹麦大学和汉堡大学的研究团队于2026年提出的一个时间感知型生物医学知识图谱。该数据集的核心研究问题在于，现有的生物医学知识图谱（如PrimeKG、Hetionet、iKraph）将疾病关联视为静态事实，缺乏临床推理所必需的时间维度——例如，同一症状在3岁时与13岁时可能指向截然不同的疾病。为此，研究团队构建了一个包含460,497条经证据验证的三元组、覆盖13,431种疾病的知识图谱，并为每条关联赋予了发病时间窗口、疾病进展阶段等时间组件。该数据集引入了疾病自主的多智能体流水线、多LLM共识机制以及六信号可信度评分，最终在Orphadata上达到了92.7%的有效准确率，并为6,250种此前缺乏时序数据支持的疾病首次提供了结构化的时间锚定，显著拓展了生物医学知识图谱在纵向临床推理中的适用边界。

当前挑战

ChronoMedKG致力于解决生物医学知识图谱领域长期存在的核心挑战：即知识关联缺乏时间维度的刻画，导致临床推理在面对疾病进展时序、发病年龄分化等关键问题时无能为力。现有资源如HPOA和Orphadata仅提供粗粒度且局限的疾病层级时间信息，无法支撑细粒度的表型-时间推理。在知识图谱构建过程中，研究团队面临了一系列严峻挑战：包括如何从海量非结构化的文献中提取具有时间锚定的三元组、如何在多LLM协作中实现可靠的知识一致性与去噪、如何构建本体对齐与可信度评估体系以确保质量，以及如何在缺乏金标准的情况下对新颖覆盖的疾病进行验证。该数据集通过多智能体共识、证据溯源与病种分层策略，有效应对了从规模构想到质量承诺的全链条挑战。

常用场景

经典使用场景

ChronoMedKG在临床推理研究中被广泛用作时间感知型生物医学知识图谱，其最经典的使用场景是为疾病-表型关联提供动态时间窗口。通过将每个临床关联锚定在发病年龄、进展阶段或疾病里程碑上，该数据集使研究者能够超越传统静态知识图谱的局限，探索“何时”而非仅仅“何种”临床特征出现的问题。在时间诊疗推理任务中，例如判断特定症状在何种年龄区间内具有诊断意义，或比较不同疾病的发病时序，ChronoMedKG作为首个提供细粒度、每表型时间注释的大规模知识图谱，已成为标准参考基准。其附带的ChronoTQA基准测试进一步规范化了时间临床问答评估流程，涵盖时间窗口识别、时间鉴别诊断和跨疾病发病比较等多种任务类型，为生物医学时间推理研究奠定了坚实的评测基础。

解决学术问题

ChronoMedKG着力解决了生物医学知识图谱领域一个长期被忽视的结构性缺陷：现有主流知识图谱（如PrimeKG、Hetionet、iKraph）将所有疾病关联视为静态事实，完全缺失时间维度，无法支持纵向临床推理。该数据集通过多智能体协作流水线，从大量生物医学文献中自动提取并验证了超过46万条带有时间锚定的知识三元组，覆盖13,431种疾病，为6,250种此前未在任何结构化资源中拥有发病时间信息的疾病提供了首次时间注释。这一突破性贡献在学术上填补了静态图谱与临床时间推理之间的鸿沟，使得研究者能够探索疾病进展的时间轨迹、进行证据时序分析，并评估文献知识的时效性衰减。其对前沿大语言模型的评测表明，时间推理准确性比静态推理平均低30个百分点，深刻揭示了当前AI系统在临床时间认知维度上的系统性不足。

衍生相关工作

ChronoMedKG的提出催生了多个具有深远影响的衍生研究方向。首先，ChronoTQA作为首个时间生物医学问答基准测试，建立了包含8种任务类型、共计3,341道题目的系统性评估框架，激发了大量针对大语言模型时间临床推理能力的研究工作，揭示了当前AI系统在此维度上的显著短板。其次，该数据集开创性地采用多模型共识机制构建知识图谱，其四智能体自主流水线为后续诸如KARMA（冲突解决导向）、MedKGent（文献时间序列导向）和AutoBioKG（上下文状态导向）等并发性智能体知识图谱系统提供了可借鉴的方法论范式，共同推动了生物医学知识图谱从静态向多维度时态表示的演进。再者，ChronoMedKG独有的大规模发病时间覆盖数据直接支撑了疾病轨迹聚类分析、证据衰减分析和时间感知链接预测等下游任务的开展，其提供的全景式时间注释为精准医学中的早期筛查窗口优化、治疗时机选择和疾病进展建模提供了前所未有的结构化数据基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集