parkinsons-evidence-to-discovery-prioritisation
收藏Hugging Face2026-04-26 更新2026-04-27 收录
下载链接:
https://huggingface.co/datasets/hssling/parkinsons-evidence-to-discovery-prioritisation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为帕金森病证据到发现优先排序数据集,是一个整合了多种研究资源的综合性数据集,旨在支持帕金森病(PD)预防和疾病修饰治疗策略的优先排序研究。数据集包含以下内容:证据优先级评分、路径到干预框架、个体和公共卫生预防措施、ClinicalTrials.gov挖掘输出、GSE72267血液转录组差异表达分析结果、GO生物过程富集分析、探索性ReactomePA富集分析、药物再利用候选排名、多组学扩展清单和路径重复缺口图、公共NCBI GEO/GDS发现结果(涵盖脑、血液、蛋白质组学、代谢组学、甲基化和单细胞数据集)、遗传因果三角测量和变异到路径评分矩阵(包含Open Targets和GWAS Catalog API输出)、药物发现深化输出(包括LINCS访问状态、ChEMBL选择性、ADMET/BBB筛选、对接准备和ClinicalTrials.gov试验缺口)、实验验证工作包(包含实验设计、对照和通过/不通过标准)、以及出版物图表、脚本、表格、手稿文件、参考文献审计和可重复性日志。数据集结构包括多个CSV文件,分布在不同的子目录中,如候选干预措施排名、路径干预框架、临床试验概况、转录组学分析结果、药物再利用候选、多组学数据集清单等。数据集适用于研究、教育、验证、可重复性和假设生成,但不应用于诊断工具、临床决策支持或治疗推荐系统。数据集基于CC BY 4.0许可发布,用户需遵守上游资源的引用要求。
创建时间:
2026-04-25
原始信息汇总
数据集概述:帕金森病证据到发现优先级数据集
基本信息
- 数据集名称:Parkinsons Disease Evidence-to-Discovery Prioritisation Dataset(帕金森病证据到发现优先级数据集)
- 许可证:CC BY 4.0
- 语言:英语
- 数据集大小:n<1K(小于1000条记录)
- 任务类别:表格分类、特征提取、文本分类
数据集内容与结构
该数据集整合了帕金森病(PD)预防和疾病修饰治疗策略优先级排序的多维度研究成果,包含以下核心模块:
数据处理与证据评分
candidate_interventions_ranked.csv— 候选干预措施排名pathway_intervention_framework.csv— 通路到干预框架individual_prevention_measures.csv— 个体预防措施evidence_map.csv— 证据图谱
临床试验数据
clinical_trials_landscape.csv— 临床试验全景分析
组学数据
GSE72267_limma_DEG_all.csv— GSE72267 血液转录组差异表达分析结果GSE72267_DEG_summary.csv— 差异表达基因摘要GSE72267_GO_BP_enrichment_top500.csv— GO生物过程富集分析GSE72267_Reactome_enrichment_top500_exploratory.csv— Reactome通路富集分析
药物重定位
drug_repurposing_candidates.csv— 药物重定位候选排名
组学扩展
- 多组学数据集清单、通路复发图谱、组学模态缺口图、公共多组学数据集发现
遗传学数据
- 遗传因果三角测量矩阵、变异到通路评分矩阵、Open Targets 和 GWAS Catalog API 输出
药物发现深化
- 药物发现深化矩阵、对接就绪度、临床试验缺口图、ChEMBL选择性摘要
其他资源
- 论文图表、脚本、表格、手稿文件、参考文献审计、可重复性日志、实验验证工作包、质量控制标准
当前关键发现
评分框架中优先级最高的候选策略包括:
- 减少农药暴露
- 结构化有氧/抗阻运动
- GLP-1受体通路策略
- 地中海/MIND饮食模式
- LRRK2抑制
- GBA/溶酶体调节
- 头部损伤预防
- 减少空气污染
数据来源与使用说明
- 上游资源:公共文献记录、ClinicalTrials.gov、GEO 数据集 GSE72267、GO、Reactome 等
- 预期用途:验证证据评分规则、重新分析通路干预排名、扩展药物重定位优先级、重现组学分析、教学和假设生成
- 禁止用途:不得用作诊断工具、临床决策支持、治疗推荐系统,或声称任何干预措施能治愈帕金森病
存储库与验证
GitHub 存储库地址:https://github.com/hssling/parkinsons-evidence-to-discovery-prioritisation,包含版本控制的证据资产、脚本、手稿文件、可重复性检查和持续集成验证。
搜集汇总
数据集介绍

构建方式
本数据集源于一项针对帕金森病预防及疾病修饰治疗策略优先级的AI辅助证据综合与计算验证项目,系统整合了多层次生物医学数据资产。构建过程融合证据优先级评分、通路至干预框架、个体及公共卫生预防措施,并挖掘ClinicalTrials.gov临床试验数据、GSE72267血液转录组差异表达结果、GO生物过程富集与Reactome通路探索性分析。此外,纳入药物重定位候选排名、多组学扩展清单与通路重现性缺口图谱、公共NCBI GEO/GDS发现成果,以及基于Open Targets和GWAS Catalog API的遗传因果三角验证与变异至通路评分矩阵。药物发现深化模块涵盖LINCS访问状态、ChEMBL选择性、ADMET/BBB分级、对接就绪性及临床试验缺口分析,最终形成包含实验验证工作包、图表、脚本与可重复性日志的综合性研究资源。
使用方法
使用者可依据多层级结构化目录灵活调用数据,支持验证或修改证据评分规则、重新分析通路干预排名、扩展药物重定位优先级排序。针对GSE72267组学分析,可复现其差异表达与通路富集流程,用于教学或假设生成。遗传学与药物深化模块的矩阵文件允许开展因果三角验证与候选化合物筛选。数据集明确限定非临床用途,禁止作为诊断工具、临床决策支持或治疗推荐系统,所有二次利用需遵守上游资源引用要求及CC BY 4.0许可条款,并参考references_audit.csv文件中的原始文献追溯。
背景与挑战
背景概述
帕金森病(Parkinson's disease, PD)作为全球第二大神经退行性疾病,其病因复杂、病程漫长,迄今为止尚无确凿的疾病修饰疗法或治愈手段。在此背景下,该数据集于2024年由HSS Ling研究团队创建,旨在通过系统整合多源生物医学证据,构建从基础发现到临床干预优先级排序的计算框架。数据集聚焦于帕金森病的预防与疾病修饰治疗策略优先级评估,融合了转录组学、遗传学、药物重定位、临床试验挖掘及多组学扩展等多维数据,形成了一套涵盖证据评分、通路干预框架及个性化公共卫生措施的综合资源。该数据集不仅为神经科学与生物信息学交叉领域提供了可复现的研究基石,还通过公开API输出与开源代码,显著推动了证据驱动型疾病优先级排序方法学的发展,对生物医学证据综合与计算药理学领域产生了深远影响。
当前挑战
该数据集面临的核心挑战在于帕金森病领域的复杂性与数据异构性。首先,疾病修饰策略优先级排序本身是一个多目标决策问题,需要平衡预防干预、药物重定位及公共卫生措施间的权重,而现有证据质量参差不齐,缺乏统一的金标准评估体系。其次,在构建过程中,数据集整合了来自临床队列、组学实验、公共数据库及文献挖掘的异构信息,面临数据源格式不统一、缺失值处理及跨平台标准化等技术难题。特别地,GSE72267外周血转录组分析中,22,277个探针均未达到预设的显著性阈值,导致后续富集分析仅具有探索性,凸显了低统计效力与高维数据噪声对证据可靠性的制约。此外,遗传因果三角测量与药物深化挖掘中,部分模块因输入权限或专业工作流不可及而标注为“阻塞”,使得证据链条完整性受限。这些挑战共同构成了从混杂证据中提炼稳健优先级排序的显著障碍。
常用场景
经典使用场景
帕金森病(Parkinson's Disease, PD)作为一种病因复杂的神经退行性疾病,其预防与疾病修饰治疗策略的优先排序是临床与转化医学领域的核心挑战。该数据集整合了来自临床前研究、临床试验登记、转录组学、遗传学、药物重定位等多维证据,构建了一个系统化的证据-发现优先级评估框架。其经典使用场景在于,研究者可基于该数据集对候选干预措施进行多准则优先级排序,例如评估农药暴露减少、有氧运动、GLP-1受体通路策略等干预方案在预防或延缓疾病进程中的相对重要性。同时,数据集提供的通路到干预的映射框架,支持从分子机制到公共卫生措施的跨尺度分析,为PD研究提供了从证据整合到优先级决策的标准化工具。
解决学术问题
在帕金森病研究领域,长期存在一个问题:如何从海量且异质的文献、组学数据、临床试验结果中提炼出最具转化潜力的干预靶点与策略。该数据集通过整合证据优先级评分、多组学富集分析、遗传因果三角测量与GWAS变异-通路评分矩阵,系统性地填补了从基础发现到临床前验证的鸿沟。它解决了传统证据合成中常见的碎片化、主观性强、可重复性差等弊端,为帕金森病的预防医学与精准干预提供了数据驱动的决策支持。其意义在于,不仅促进了PD研究范式的透明化和可验证性,还推动了证据医学在神经退行性疾病领域的规范化应用,对于理解疾病异质性、优化临床试验设计具有深远影响。
实际应用
该数据集的实际应用场景横跨基础研究、临床转化与公共卫生决策。在药物研发领域,药物重定位候选排名与化学选择性评估可辅助制药企业筛选具有血脑屏障透过能力与低毒性的先导化合物,如LRRK2抑制剂或GBA/溶酶体调节剂。在公共卫生层面,个体化预防措施评估与人群水平干预优先排序(如有氧运动与空气污染防控)为政策制定者提供了循证依据。此外,数据集中的临床试验景观分析与试验缺口图谱能够帮助研究机构识别尚未覆盖的干预方向,优化资源配置与临床试验注册策略。通过验证工作包提供的实验方案、对照标准与通过/不通过规则,实验室可快速搭建可重复的验证流程,加速从假说到实验验证的闭环。
数据集最近研究
最新研究方向
当前帕金森病研究正从单一生物标志物探索转向多维度证据整合与计算优先排序,该数据集融合了转录组学、临床实验挖掘、药物重定位及遗传因果推断等多源数据,系统构建了从基础发现到公共卫生干预的优先级评估框架。其前沿性体现在利用AI辅助证据综合对LRRK2抑制、GLP-1受体通路、地中海饮食等干预措施进行分级评分,并创新性地引入遗传三角验证与通路富集缺口映射,为疾病修饰策略的理性选择提供了可复现的计算范式。这一整合基因组学、临床证据与可干预方向的方法论,推动了帕金森病预防研究向精准化、系统化演进,对优化临床试验资源配置和揭示新型治疗靶点具有重要科学意义。
以上内容由遇见数据集搜集并总结生成



