scDrugMap
收藏arXiv2025-05-09 更新2025-05-13 收录
下载链接:
https://scdrugmap.com/
下载链接
链接失效反馈资源简介:
scDrugMap是一个综合性的药物反应预测框架,它集成了Python命令行工具和交互式网络服务器。该框架支持评估多种基础模型,包括八个单细胞基础模型和两个大型语言模型,使用大规模的单细胞数据集进行预测。scDrugMap包含一个精选数据资源,由23项研究中的36个数据集的326,751个细胞组成,以及一个包含来自17项研究的17个数据集的18,856个细胞的验证集合。该框架通过两个评估场景进行了全面的基准测试:合并数据评估和交叉数据评估。scDrugMap提供了一个用户友好的、灵活的平台,用于支持药物发现和转化研究。
scDrugMap is a comprehensive drug response prediction framework that integrates Python command-line tools and an interactive web server. This framework supports evaluating multiple foundational models, including eight single-cell foundational models and two large language models, using large-scale single-cell datasets for prediction. scDrugMap includes a curated data resource composed of 326,751 cells from 36 datasets across 23 studies, as well as a validation set containing 18,856 cells from 17 datasets derived from 17 studies. The framework has been comprehensively benchmarked through two evaluation scenarios: merged data evaluation and cross-data evaluation. scDrugMap provides a user-friendly and flexible platform to support drug discovery and translational research.
提供机构:
美国佛罗里达大学健康成果与生物医学信息系
创建时间:
2025-05-09
原始信息汇总
scDrugMap数据集概述
数据集简介
- 名称:scDrugMap
- 类型:单细胞药物响应图谱工具平台
- 功能:用于单细胞药物响应映射的综合工具平台
主要功能
- LLM工具
- 支持使用单细胞数据和药物响应运行LLM工具
- 数据浏览
- 提供相关数据集和分析结果的浏览与下载
使用指南
- 上传单细胞数据
- 调整必要参数
- 下载并探索结果
使用前准备
- 需阅读README文件以准备数据
AI搜集汇总
数据集介绍

构建方式
在单细胞转录组学领域,scDrugMap数据集的构建采用了系统性的文献检索方法,通过PubMed数据库筛选截至2024年发表的药物耐药性相关研究,结合关键词'(drug resistance) AND ((single cell) OR (scRNA)'进行严格筛选。数据集包含两个主要部分:核心数据集(326,751个细胞,来自23项研究的36个数据集)和验证数据集(18,856个细胞,来自6项研究的17个数据集)。所有样本均来自人类组织,并包含细胞水平的药物反应二元标注(敏感/耐药),其中耐药细胞来自治疗前后无应答样本,敏感细胞则来自应答样本。数据预处理阶段采用统一的质量控制标准,确保数据的一致性和可靠性。
特点
scDrugMap数据集具有显著的跨维度特征,涵盖14种癌症类型、3种治疗方式、5种组织类型和21种治疗方案,为药物反应预测提供了多维度的研究视角。数据集特别注重样本平衡性,大多数亚组(如靶向治疗、骨髓抽吸物和多发性骨髓瘤)中药物敏感与耐药细胞的分布保持均衡。其突出优势在于整合了来自不同实验室和测序平台的单细胞数据,通过严格的批次效应控制和技术变异校正,为大规模基础模型的性能评估提供了标准化测试环境。数据集还创新性地设计了两种评估场景(合并数据评估和交叉数据评估),可全面测试模型在不同应用场景下的预测能力。
使用方法
scDrugMap提供了灵活多样的使用途径,用户可通过Python命令行工具或交互式网页服务器(https://scdrugmap.com/)访问该平台。研究支持三种模型训练策略:层冻结训练、使用低秩适应(LoRA)的微调训练以及零样本推理。对于基础模型评估,系统实现了10折交叉验证,确保结果的可重复性。在具体应用时,用户可根据需求选择八种单细胞专用基础模型(如scFoundation、scGPT等)或两种通用语言模型(LLaMa3-8B和GPT4o-mini)。平台还提供UMAP可视化功能,可直观展示模型对药物敏感/耐药细胞的区分能力。输出结果包含F1分数、AUROC、精确度和召回率等多项指标,满足不同研究场景的评估需求。
背景与挑战
背景概述
scDrugMap是一个专注于单细胞药物反应预测的基准测试框架,由佛罗里达大学健康结果与生物医学信息学系的Qing Wang等人于2024年开发。该数据集整合了来自36个单细胞RNA测序数据集共326,751个细胞,覆盖14种癌症类型、3种治疗类型和5种组织类型。scDrugMap旨在评估大规模基础模型在单细胞药物反应预测中的性能,为药物发现和精准医疗提供支持。该数据集的建立填补了单细胞领域基础模型系统性评估的空白,推动了计算药物发现的发展。
当前挑战
scDrugMap面临的挑战主要包括两个方面:领域问题的挑战和构建过程的挑战。在领域问题方面,药物反应预测需要解决单细胞数据的高维度、噪声和稀疏性问题,同时克服不同实验室间样本制备和测序平台带来的批次效应。在构建过程中,挑战包括大规模单细胞数据的整合与标注,确保数据质量和一致性,以及设计合理的评估策略(如跨数据集评估)以验证模型的泛化能力。此外,如何平衡模型的计算效率与预测准确性也是关键挑战之一。
常用场景
经典使用场景
scDrugMap数据集在药物反应预测领域具有广泛的应用价值,尤其在单细胞转录组数据分析中表现突出。该数据集通过整合多种癌症类型、组织类型和治疗方案的数据,为研究人员提供了一个全面的基准测试平台。其经典使用场景包括利用预训练的大型基础模型(如scFoundation、scGPT等)对单细胞数据进行药物敏感性预测,从而帮助识别潜在的耐药机制和敏感细胞亚群。
实际应用
在实际应用中,scDrugMap被广泛用于药物开发和临床前研究。例如,研究人员可以利用该数据集预测患者肿瘤细胞对特定化疗药物或靶向治疗的敏感性,从而优化治疗方案。此外,scDrugMap的交互式网络服务器和命令行工具使得药物反应预测更加便捷,为生物医学研究人员和临床医生提供了一个高效的平台,用于探索耐药机制和开发新型联合治疗策略。
衍生相关工作
scDrugMap的发布催生了一系列相关研究工作,特别是在单细胞数据分析和药物反应预测领域。基于该数据集,研究人员开发了多种改进的预测模型和算法,如结合多组学数据的集成学习方法、针对特定癌症类型的定制化模型等。此外,scDrugMap还启发了对大型基础模型在生物医学应用中性能的深入探讨,推动了单细胞数据分析和药物发现领域的交叉创新。
以上内容由AI搜集并总结生成



