five

SPATCH

收藏
github2024-12-11 更新2025-01-03 收录
下载链接:
https://github.com/zenglab-pku/SPATCH
下载链接
链接失效反馈
官方服务:
资源简介:
SPATCH是一个用于亚细胞和高通量平台的空间转录组学资源,提供了多种空间转录组学技术的首次基准测试,包括亚细胞分辨率和大量基因的面板。

SPATCH is a spatial transcriptomics resource designed for subcellular-resolution and high-throughput platforms. It presents the first benchmarking of multiple spatial transcriptomics technologies, including those with subcellular resolution and large-scale gene panels.
创建时间:
2024-12-10
原始信息汇总

SPATCH数据集概述

数据集简介

SPATCH(SPAtial Transcriptomics resource for subCellular and High-throughput platforms)是一个空间转录组学资源,专注于亚细胞分辨率和高通量平台的数据集。该数据集首次对最先进的空间转录组学技术进行了基准测试,并提供了大量基因的面板数据。

数据集特点

  • 首次基准测试:对具有亚细胞分辨率和大规模基因面板的空间转录组学技术进行了首次基准测试。
  • 多工具基准测试:在数据集上对多种空间转录组学分析工具进行了基准测试。
  • 空间蛋白质组学结合:使用相邻切片的空间蛋白质组学(CODEX)数据进行对比分析。
  • 多平台分析代码:提供了用于分析多平台空间转录组学的代码,包括数据读取、空间聚类、细胞注释等。

数据处理功能

  • 1_load_data.py:加载不同平台的原始表达或转录数据,使用scanpy在8微米分辨率或细胞分辨率下保存为h5ad格式。
  • 2_8um_bin.py:将Xenium或CosMx的转录组数据处理为8微米分辨率,并去除组织区域外的信号。
  • 3_registeration.py:对配对的图像进行配准,并将变换应用于CODEX的其他通道或空间转录组学数据的空间坐标。
  • 4_diffusion.py:计算sST平台内部和外部点之间的相对扩散效应和最小距离。
  • 5_correlation_with_codex.py:计算空间网格上ST数据与CODEX数据之间的相关性。
  • 6_scrna.r:对单细胞RNA测序数据进行预处理。
  • 7_cluster.py:对ST数据进行聚类。
  • 8_cell_shape.py:计算描述细胞形状的统计量。
  • 9_st_annotation.py:将单细胞RNA测序的注释转移到ST数据上。
  • 9_st_annotation_consistency.r:评估不同注释工具之间的一致性。
  • 10_spatial_cluster.py:对ST和CODEX数据进行空间聚类,并评估它们的一致性。

数据访问

可以通过以下链接在线访问SPATCH数据集:https://spatch.pku-genomics.org

搜集汇总
数据集介绍
main_image_url
构建方式
SPATCH数据集的构建依托于先进的亚细胞分辨率空间转录组技术,结合大规模基因面板进行首次基准测试。该数据集通过整合多种空间转录组分析工具,对多平台数据进行了系统性的处理与分析。此外,SPATCH还利用了相邻切片的空间蛋白质组学(CODEX)数据,进一步增强了数据的多维性。数据处理流程包括数据读取、空间聚类、细胞注释等关键步骤,确保了数据的高质量和可重复性。
特点
SPATCH数据集的特点在于其首次对亚细胞分辨率空间转录组技术进行了基准测试,涵盖了多种先进平台的数据。数据集不仅包含了空间转录组数据,还整合了空间蛋白质组学数据,提供了多维度的生物学信息。此外,SPATCH还提供了多种分析工具和代码,支持用户对数据进行深入的空间聚类、细胞注释和一致性评估,极大地提升了数据的可用性和研究价值。
使用方法
SPATCH数据集的使用方法包括多个关键步骤,用户可以通过提供的Python和R脚本进行数据处理。首先,使用`1_load_data.py`加载不同平台的原始表达数据,并将其保存为h5ad格式。随后,通过`2_8um_bin.py`将Xenium或CosMx平台的转录组数据处理为8 µm分辨率,并去除组织区域外的信号。用户还可以利用`3_registeration.py`进行图像配准,并将变换应用于CODEX或ST数据的其他通道。此外,数据集还提供了用于空间聚类、细胞注释和一致性评估的脚本,如`7_cluster.py`和`9_st_annotation.py`,帮助用户进行深入的数据分析。
背景与挑战
背景概述
SPATCH数据集由北京大学基因组学研究中心于近年推出,旨在为空间转录组学技术提供高分辨率和多基因面板的基准测试。该数据集首次整合了多种先进的空间转录组学技术,并利用相邻切片的空间蛋白质组学(CODEX)数据进行验证。SPATCH不仅为研究人员提供了高质量的数据资源,还开发了多种数据处理工具,包括数据读取、空间聚类、细胞注释等功能。该数据集的推出极大地推动了空间转录组学领域的发展,为细胞水平的研究提供了新的视角和方法。
当前挑战
SPATCH数据集在解决空间转录组学领域的高分辨率数据获取和多平台技术整合方面面临诸多挑战。首先,不同平台的数据格式和分辨率差异较大,如何实现数据的统一处理和标准化是一个关键问题。其次,空间转录组学与蛋白质组学数据的整合需要精确的配准和转换,这对算法的准确性和效率提出了较高要求。此外,细胞注释的跨平台一致性评估也是一个复杂的问题,需要开发新的算法和工具来确保注释的准确性和可靠性。这些挑战不仅考验了数据集的构建过程,也为未来的研究提供了重要的方向。
常用场景
经典使用场景
SPATCH数据集在空间转录组学领域中被广泛应用于技术平台的基准测试。通过整合多种先进的空间转录组技术,该数据集为研究人员提供了一个标准化的框架,用于评估不同技术在亚细胞分辨率和大规模基因面板上的表现。这种基准测试不仅帮助研究者选择最适合其研究需求的技术平台,还为技术开发者提供了改进和优化的方向。
实际应用
在实际应用中,SPATCH数据集被用于指导生物医学研究中的空间转录组实验设计。例如,在肿瘤微环境研究中,研究者可以利用该数据集选择最适合的技术平台,以精确解析肿瘤细胞与周围基质的相互作用。此外,数据集的分析工具还被用于开发新的空间转录组数据分析方法,提升了数据处理和解释的准确性。
衍生相关工作
SPATCH数据集催生了一系列相关研究,特别是在空间转录组数据分析工具的开发和优化方面。基于该数据集,研究者提出了多种新的空间聚类和细胞注释算法,进一步提升了空间转录组数据的解析能力。此外,数据集还被用于开发跨组学整合分析工具,推动了空间转录组学与其他组学技术的深度融合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作