five

JUMP Cell Painting Datasets

收藏
github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/jump-cellpainting/datasets
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由JUMP-Cell Painting Consortium生成的细胞绘画图像数据集集合,部分资金来自马萨诸塞州生命科学中心。该集合目前包括4个数据集,主要数据集包含116k化学和超过15k遗传扰动,以及3个用于测试不同扰动条件的试点数据集。

This is a collection of cell painting image datasets generated by the JUMP-Cell Painting Consortium, with partial funding from the Massachusetts Life Sciences Center. The collection currently includes four datasets, with the primary dataset containing 116k chemical and over 15k genetic perturbations, along with three pilot datasets for testing different perturbation conditions.
创建时间:
2022-10-16
原始信息汇总

数据集概述

数据集名称

JUMP Cell Painting Datasets

数据集来源

由JUMP-Cell Painting Consortium生成,部分资金来自Massachusetts Life Sciences Center。

数据集内容

当前包含4个数据集:

  1. 主要数据集cpg0016:包含116k化学和>15k遗传扰动,使用人类U2OS osteosarcoma细胞,由12个数据生成中心共同创建。
  2. 3个试点数据集:用于测试不同的扰动条件(cpg0000)、染色条件(cpg0001)和显微镜(cpg0002)。

当前可用内容

  • 三个试点数据集的所有数据组件。
  • 主要数据集的大部分数据组件,包括图像、原始CellProfiler输出、单细胞配置文件、聚合CellProfiler配置文件。
  • 元数据文件的初稿。
  • 用于加载和检查主要数据集数据的示例笔记本。
  • 加载主要数据集中不同子集数据的教程。

即将推出的内容

  • 扩展元数据和笔记本以包括三个试点数据集。
  • 从ChEMBL和其他来源获取的化合物注释。
  • 剩余的数据组件,包括归一化配置文件、特征选择配置文件、治疗级共识配置文件、质量控制结果。
  • 使用预训练神经网络为所有4个数据集生成的深度学习嵌入。

数据集使用说明

  • 示例笔记本提供了如何加载主要数据集数据的详细信息。
  • 安装Python依赖并激活虚拟环境后,可以运行笔记本。

数据集存储位置

所有数据托管在AWS的Registry of Open Data上的Cell Painting Gallery。

引用和许可证

  • 数据集整体使用CC0 1.0 Universal许可证。
  • 引用时,请参考Chandrasekaran et al., 2023,并使用提供的格式。
  • 对于单个数据集的引用,请遵循Cell Painting Gallery的指南。

支持与合作

  • 由多个科学组织和合作伙伴支持,包括Ardigen、Google Research等。
  • 资金支持来自Massachusetts Life Sciences Center和NIH。
搜集汇总
数据集介绍
main_image_url
构建方式
JUMP Cell Painting Datasets由JUMP-Cell Painting Consortium精心构建,该联盟汇集了来自Ksilink、Amgen、AstraZeneca等多家知名机构的科学家。数据集的生成基于Cell Painting技术,这是一种高内涵成像方法,旨在通过多通道成像捕捉细胞的多种生物学特征。该数据集的构建过程涉及对多种细胞类型的详细成像,确保了数据的多样性和代表性。此外,数据集的存储和分发得到了AWS Open Data Sponsorship Program的支持,确保了数据的高效管理和广泛可用性。
特点
JUMP Cell Painting Datasets的显著特点在于其高度的多样性和复杂性。数据集包含了来自不同生物学背景的细胞图像,涵盖了多种细胞类型和生物学状态,为研究者提供了丰富的数据资源。此外,该数据集采用了多通道成像技术,能够同时捕捉细胞的多个生物学特征,从而提供了更为全面和深入的分析基础。数据集的构建还得到了多家知名机构的支持和合作,确保了数据的高质量和科学可靠性。
使用方法
JUMP Cell Painting Datasets适用于多种生物医学研究领域,特别是那些需要高内涵成像分析的应用。研究者可以通过访问数据集的官方网站或使用提供的API接口,轻松获取所需的图像数据。数据集的多样性和复杂性使其非常适合用于开发和验证新的图像分析算法,以及探索细胞生物学的复杂机制。此外,数据集的高质量成像和详细标注也为机器学习和深度学习模型的训练提供了理想的数据基础。
背景与挑战
背景概述
JUMP Cell Painting Datasets是由JUMP-Cell Painting Consortium创建的一系列细胞绘图(Cell Painting)图像数据集。该数据集的创建旨在通过高内涵成像技术,对细胞进行多维度的表型分析,从而为药物发现和生物医学研究提供丰富的数据支持。该数据集的开发得到了多家知名制药公司和研究机构的支持,包括Amgen、AstraZeneca、Bayer等,以及Google Research、Nomic Bio等技术合作伙伴的参与。此外,该项目的资金支持来自于Massachusetts Life Sciences Center和National Institutes of Health等机构,主要研究人员Anne Carpenter在细胞图像分析领域具有显著影响力。
当前挑战
JUMP Cell Painting Datasets在构建过程中面临多重挑战。首先,细胞绘图技术需要处理大量的高维度图像数据,这对数据存储和处理能力提出了极高的要求。其次,如何从这些复杂的图像数据中提取有意义的生物学信息,是一个技术上的难题。此外,数据集的多样性和复杂性也增加了数据标准化和一致性处理的难度。最后,跨机构和跨领域的合作需要协调各方资源和标准,确保数据的质量和可用性。
常用场景
经典使用场景
在生物医学领域,JUMP Cell Painting Datasets 被广泛用于高内涵筛选(HCS)和细胞图像分析。该数据集通过多通道成像技术,捕捉细胞在不同条件下的形态和功能变化,为研究人员提供了一个丰富的数据资源,用于探索药物作用机制、细胞信号传导路径以及疾病模型验证。
实际应用
在实际应用中,JUMP Cell Painting Datasets 被制药公司和研究机构用于药物发现和开发过程。通过分析细胞在不同药物处理下的反应,研究人员可以快速筛选出潜在的有效化合物,并评估其安全性和副作用。此外,该数据集还支持个性化医疗的发展,帮助医生根据患者的细胞特征选择最合适的治疗方案。
衍生相关工作
基于 JUMP Cell Painting Datasets,许多研究工作得以展开,包括开发新的图像分析算法、构建细胞表型数据库以及探索细胞间的相互作用。这些衍生工作不仅提升了数据集的应用价值,还促进了生物信息学和机器学习在生物医学领域的融合,为未来的研究提供了新的方向和工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作