JLrumberger/Pan-Multiplex
收藏Pan-Multiplex (Pan-M) 数据集
概述
Pan-Multiplex (Pan-M) 数据集是为了训练 Nimbus 模型,用于发表的论文 "Automated classification of cellular expression in multiplexed imaging data with Nimbus" 而构建的。该数据集包含来自不同模态、组织和蛋白质标记面板的多重成像数据。
构建方法
数据集通过半自动流程构建,原始研究数据的作者分配的细胞类型被映射回其预期的标记活性。此外,每个数据集的3个视野由4位专家注释者校对约110万个注释,这些注释作为评估算法的金标准。
数据集结构
数据集包含五个子集,分别存储在单独的文件夹中:
codex_colonmibi_breastmibi_deciduavectra_colonvectra_pancreas
数据集的文件夹结构如下:
. ├── data │ ├── codex_colon │ ├── vectra_colon │ ├── vectra_pancreas │ ├── mibi_decidua │ ├── mibi_breast │ ├── experimental_results.csv │ ├── gt_pred_ie_consolidated.csv
使用方法
解压缩后,数据应存储在上述文件夹结构中,以便使用提供的代码进行训练和推理。构建用于训练的二进制分割图,可以使用 segmentation_data_prep.py 和 simple_data_prep.py 代码。
引用
使用该数据集时,请引用以下论文:
@article{rum2024nimbus, title={Automated classification of cellular expression in multiplexed imaging data with Nimbus}, author={Rumberger, J. Lorenz and Greenwald, Noah F. and Ranek, Jolene S. and Boonrat, Potchara and Walker, Cameron and Franzen, Jannik and Varra, Sricharan Reddy and Kong, Alex and Sowers, Cameron and Liu, Candace C. and Averbukh, Inna and Piyadasa, Hadeesha and Vanguri, Rami and Nederlof, Iris and Wang, Xuefei Julie and Van Valen, David and Kok, Marleen and Hollman, Travis J. and Kainmueller, Dagmar and Angelo, Michael}, journal={bioRxiv}, pages={2024--05}, year={2024}, publisher={Cold Spring Harbor Laboratory} }




