SageBio/astrazeneca-sanger-drug-combination-prediction

Name: SageBio/astrazeneca-sanger-drug-combination-prediction
Creator: SageBio
Published: 2023-08-25 01:33:55
License: 暂无描述

Hugging Face2023-08-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SageBio/astrazeneca-sanger-drug-combination-prediction

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: other --- This is data from the AstraZeneca-Sanger Drug Combination Prediction DREAM challenge. This data is from challenge 1 Pharmacology as described [here](https://www.synapse.org/#!Synapse:syn4231880/wiki/235651) To download files in this dataset, you must do the following: 1. Register for a Synapse account After registering for an account 2. Accept the terms of conditions and submit request for access [here](https://www.synapse.org/#!Synapse:syn18496666) ``` PS: Project-specific restriction: Data use is limited to use within an approved project ``` 4. Create a personal access token and install the Python client. ``` pip install synapseclient export SYNAPSE_AUTH_TOKEN=<Access Token here> ``` 5. Load the dataset using the huggingface datasets Python API ``` from datasets import load_dataset dataset = load_dataset('SageBio/astrazeneca-sanger-drug-combination-prediction', split='train') ```

许可证：其他本数据集源自阿斯利康-桑格药物联合预测DREAM挑战赛。本数据集对应挑战赛的第一主题：药理学，详细说明可参阅[此处](https://www.synapse.org/#!Synapse:syn4231880/wiki/235651) 若需下载本数据集内的文件，请按以下步骤操作： 1. 注册Synapse账号 2. 接受使用条款并提交访问申请，申请链接为[此处](https://www.synapse.org/#!Synapse:syn18496666) 备注：项目专属限制：数据仅可用于已获批的项目中 4. 创建个人访问令牌（Token）并安装Python客户端： pip install synapseclient export SYNAPSE_AUTH_TOKEN=<此处替换为你的访问令牌> 5. 使用Hugging Face Datasets Python API加载数据集： from datasets import load_dataset dataset = load_dataset('SageBio/astrazeneca-sanger-drug-combination-prediction', split='train')

提供机构：

SageBio

原始信息汇总

数据集概述

数据来源

数据集来自AstraZeneca-Sanger药物组合预测DREAM挑战。
具体为挑战1的药理学数据，详细描述可参考此链接。

数据访问

访问数据需注册Synapse账户，并接受条款条件，提交访问请求。
数据使用限于批准的项目内。

数据下载与加载

需创建个人访问令牌并安装Python客户端。
使用Python API从huggingface加载数据集： python from datasets import load_dataset dataset = load_dataset(SageBio/astrazeneca-sanger-drug-combination-prediction, split=train)

搜集汇总

数据集介绍

构建方式

在药物发现领域，精准预测药物组合效应是加速新疗法开发的关键。该数据集源自阿斯利康-桑格药物组合预测DREAM挑战赛，聚焦于药理学任务，通过系统性实验收集了多种药物组合的相互作用数据。数据构建遵循严格的实验设计，涵盖不同浓度与细胞系下的药物反应，确保了数据的可靠性与可重复性，为计算模型提供了坚实的实证基础。

使用方法

使用本数据集需先通过Synapse平台注册并获取访问权限，遵循特定的数据使用条款。在Python环境中，通过安装synapseclient库并设置认证令牌，可利用Hugging Face的datasets API直接加载数据。加载后，数据以标准化的分割形式呈现，用户可将其集成至预测管道中，用于训练或评估药物组合效应模型，推动计算药理学研究。

背景与挑战

背景概述

在精准医疗与药物发现领域，联合用药策略因其能够增强疗效、降低耐药性而备受关注。AstraZeneca-Sanger药物联合预测DREAM挑战数据集由阿斯利康制药公司与桑格研究所于2015年前后联合创建，旨在通过公开竞赛形式推动计算模型在药物协同效应预测中的创新。该数据集聚焦于药理学层面的药物组合筛选，核心研究问题是如何利用高通量实验数据准确预测不同药物组合对细胞系的影响，从而加速抗癌药物研发进程。其发布显著促进了生物信息学与计算药理学交叉领域的发展，为后续研究提供了标准化基准。

当前挑战

该数据集致力于解决药物联合效应预测这一复杂生物医学问题，其核心挑战在于药物相互作用的非线性与细胞特异性使得预测模型需兼顾高维度特征与生物学可解释性。构建过程中，实验数据的高通量生成与质量控制要求极为严格，同时需整合多源异构数据如化合物结构、基因组信息与剂量反应曲线。此外，数据访问受限于伦理与隐私条款，研究者必须通过协同平台申请授权，这在一定程度上增加了数据使用的技术门槛与合规复杂性。

常用场景

经典使用场景

在药物发现领域，精准预测药物组合的协同效应是加速新疗法开发的关键。该数据集通过提供阿斯利康与桑格研究所合作的药物组合预测挑战赛数据，为研究人员构建和验证计算模型提供了标准化的实验基准。经典使用场景聚焦于利用机器学习算法，如随机森林或深度学习网络，分析药物对细胞系的剂量-反应曲线，从而预测未知药物组合的协同或拮抗作用，推动高通量虚拟筛选的实现。

解决学术问题

该数据集有效解决了药物组合研究中数据稀缺与标准化不足的学术难题。通过整合大规模实验生成的药物协同效应数据，它支持研究者探索组合药理学中的复杂相互作用机制，例如多靶点效应或耐药性突破。其意义在于为计算生物学和系统药理学提供了可重复的验证平台，促进了从经验性试错向数据驱动预测的范式转变，对个性化医疗和癌症治疗策略优化产生了深远影响。

实际应用

在实际应用中，该数据集被广泛用于制药企业和生物技术公司的药物研发流程。通过模型预测潜在的高协同药物组合，可大幅降低实验成本与时间，优先筛选出有前景的候选方案用于临床前研究。例如，在癌症联合疗法设计中，它帮助识别针对特定肿瘤细胞系的有效药物配对，为后续的动物实验和临床试验提供可靠依据，加速创新疗法的上市进程。

数据集最近研究