five

ADPD Dataset

收藏
github2021-12-15 更新2024-05-31 收录
下载链接:
https://github.com/NYSCF/adpd_release
下载链接
链接失效反馈
官方服务:
资源简介:
纽约干细胞基金会研究所在与谷歌加速科学合作的基础上,建立了一个高通量、高含量的基于细胞绘画的表型分析平台。该平台结合了先进的、可扩展的细胞培养自动化技术和前沿的深度学习算法。数据集主要用于帕金森病(PD)和健康控制样本的表型分析,以及药物筛选。

The New York Stem Cell Foundation Research Institute, in collaboration with Google Accelerated Science, has established a high-throughput, high-content cell painting-based phenotypic analysis platform. This platform integrates advanced, scalable cell culture automation technologies with cutting-edge deep learning algorithms. The dataset is primarily used for phenotypic analysis of Parkinson's disease (PD) and healthy control samples, as well as for drug screening.
创建时间:
2021-12-11
原始信息汇总

NYSCF Automated Deep Phenotyping Dataset (ADPD) 概述

数据集描述

  • 开发机构:纽约干细胞基金会研究所(NYSCF)与Google加速科学合作开发。
  • 技术平台:结合高级和可扩展的细胞培养自动化与尖端深度学习算法的高通量、高内容Cell Painting为基础的表型分析平台。
  • 实验设计:精心设计以最小化实验混杂因素,包括细胞系的选择和来源、自动化细胞处理和检测等。
  • 研究目标:实现跨板、布局和批次的分析和交叉验证,为大规模人群基础的表型分析和药物筛选提供技术基础。

数据集内容

  • 研究对象:帕金森病(PD)患者的原发性成纤维细胞及人口统计学匹配的健康对照。
  • 分析方法:使用深度学习与自动化Cell Painting分析相结合。
  • 研究成果:成功区分PD患者(包括散发性和LRRK2型)与健康对照,ROC AUC为0.79(标准差0.08);在96个细胞系中准确识别特定细胞系,平均准确率达91%(标准差6%)。
  • 数据集规模:据称是世界上最大的公开Cell Painting为基础的高内容成像数据集。

数据集可用性

附加资源

  • 代码和工具:提供重现论文关键发现的必要代码,包括PD与健康分类、细胞系分类,以及用于从显微镜图像生成深度嵌入的示例代码和CellProfiler管道。
搜集汇总
数据集介绍
main_image_url
构建方式
ADPD数据集由纽约干细胞基金会研究所(NYSCF)与谷歌加速科学部门合作构建,旨在通过高通量、高内涵的细胞绘画技术平台,结合先进的自动化细胞培养与深度学习算法,实现对帕金森病(PD)患者和健康对照者的原代成纤维细胞进行深度表型分析。研究设计严格控制了实验变量,包括细胞系的选择与来源、自动化细胞处理与检测流程,确保数据的高重复性和跨批次、跨板布局的可验证性。数据集包含原始和处理的图像数据,以及用于复现研究结果的代码和实时图像分析工具。
特点
ADPD数据集是目前全球最大的基于细胞绘画技术的高内涵成像公开数据集,具有高度的技术稳健性和个体特征识别能力。通过深度学习与自动化细胞绘画分析,该数据集能够有效区分帕金森病患者与健康对照者,并在96个细胞系中实现91%的准确识别率。数据集不仅为帕金森病的无偏疾病建模和药物发现提供了技术基础,还揭示了细胞个体特征的显著差异,为大规模表型分析和药物筛选提供了重要资源。
使用方法
ADPD数据集可通过NYSCF官方网站获取,用户可下载原始图像数据、处理后的数据以及相关代码。数据集附带的代码支持复现研究中的关键发现,包括帕金森病与健康对照的分类、细胞系分类以及从显微镜图像生成深度嵌入的示例代码。此外,数据集还提供了CellProfiler管道的样本代码,便于用户进行自定义分析和扩展研究。所有数据均遵循CC BY-NC-SA 4.0许可协议,确保科学社区的自由使用与共享。
背景与挑战
背景概述
ADPD数据集由纽约干细胞基金会研究所(NYSCF)与谷歌加速科学部门合作开发,旨在通过高通量、高内涵的细胞表型分析平台,结合先进的自动化细胞培养技术和深度学习算法,推动大规模群体表型分析和药物筛选。该数据集于2021年发布,专注于帕金森病(PD)患者与健康对照者的原代成纤维细胞研究。通过自动化细胞处理和Cell Painting技术,研究人员成功区分了帕金森病患者与健康对照者,并展示了该平台在疾病建模和药物发现中的潜力。ADPD数据集是目前全球最大的基于Cell Painting的高内涵成像公开数据集,为相关领域的研究提供了重要的技术基础和数据支持。
当前挑战
ADPD数据集在构建和应用过程中面临多重挑战。首先,帕金森病的异质性使得从细胞表型中提取可靠特征变得复杂,需要深度学习算法具备较高的鲁棒性和泛化能力。其次,在数据采集过程中,自动化细胞培养和成像技术的标准化至关重要,以确保跨批次和跨实验的可重复性。此外,数据集的规模庞大,处理和分析高分辨率显微镜图像对计算资源和算法效率提出了较高要求。最后,如何将深度学习模型与生物学知识相结合,以揭示帕金森病的潜在机制,仍是该领域亟待解决的关键问题。
常用场景
经典使用场景
ADPD数据集在神经科学研究中具有重要应用,特别是在帕金森病(PD)的疾病建模和药物发现领域。通过结合高通量细胞培养自动化和深度学习算法,该数据集能够对PD患者和健康对照组的成纤维细胞进行深度表型分析。这种分析不仅能够区分PD患者与健康对照组,还能在细胞系水平上识别个体特征,为疾病机制的研究提供了新的视角。
解决学术问题
ADPD数据集解决了在帕金森病研究中常见的实验重复性和数据一致性问题。通过自动化细胞处理和深度学习分析,该数据集能够在不同批次和板布局之间进行交叉验证,确保了数据的可重复性和可靠性。这一技术基础为大规模群体表型分析和药物筛选提供了支持,显著提升了研究的准确性和效率。
衍生相关工作
ADPD数据集的发布推动了多个相关研究领域的发展,特别是在细胞图像分析和深度学习应用方面。基于该数据集,研究人员开发了多种深度学习模型,用于细胞分类和表型特征提取。此外,该数据集还促进了自动化细胞处理技术的进步,为其他疾病的高通量筛选研究提供了参考和借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作