OpenTME
收藏arXiv2026-04-14 更新2026-04-17 收录
下载链接:
https://huggingface.co/datasets/Aignostics/OpenTME
下载链接
链接失效反馈官方服务:
资源简介:
OpenTME是由Aignostics联合多家研究机构开发的开放数据集,包含3634张源自癌症基因组图谱(TCGA)的H&E染色全切片图像,涵盖膀胱癌、乳腺癌、结直肠癌、肝癌和肺癌五种类型。数据集通过Atlas H&E-TME人工智能应用生成,提供单细胞分辨率的组织质量控制、组织分割、细胞检测与分类等4500余项定量指标。数据来源于TCGA公共队列,经严格质量控制筛选,旨在降低空间生物学研究门槛,支持生物标志物发现、生存建模和计算病理学方法开发等应用。
OpenTME is an open dataset developed by Aignostics in collaboration with multiple research institutions. It contains 3,634 H&E-stained whole-slide images sourced from The Cancer Genome Atlas (TCGA), covering five cancer types: bladder cancer, breast cancer, colorectal cancer, liver cancer, and lung cancer. Generated via the Atlas H&E-TME AI application, the dataset provides over 4,500 quantitative metrics including single-cell resolution tissue quality control, tissue segmentation, cell detection and classification, among others. Derived from public TCGA cohorts and screened through rigorous quality control procedures, OpenTME aims to lower the barrier to spatial biology research, and supports applications including biomarker discovery, survival modeling, and computational pathology method development.
提供机构:
Aignostics; 柏林夏里特医学院·病理学研究所; 梅奥诊所·实验室医学与病理学系; 柏林工业大学·机器学习组; 柏林学习与数据基础研究所; 韩国大学·人工智能系; 马克斯·普朗克信息学研究所; 德国癌症研究中心; 慕尼黑大学·病理学研究所; 巴伐利亚癌症研究中心
创建时间:
2026-04-14
搜集汇总
数据集介绍

构建方式
在肿瘤微环境研究领域,数字病理学与人工智能的融合为大规模定量分析提供了新的可能。OpenTME数据集的构建基于来自癌症基因组图谱(TCGA)的3,634张H&E染色全切片图像,涵盖膀胱癌、乳腺癌、结直肠癌、肝癌和肺癌五种常见癌症类型。通过Atlas H&E-TME这一基于病理学基础模型的人工智能应用,对每张切片执行了系统化的四阶段分析流程:首先进行组织质量控制以筛选有效区域,随后将组织分割为七种类型,进而检测并分类九种细胞类别,最后计算包括空间邻域分析在内的超过4,500项定量指标,从而在单细胞分辨率上实现了对肿瘤微环境的高通量、标准化表征。
使用方法
研究人员可通过Hugging Face平台申请访问这一非商业学术数据集,并利用配套的TME Studio交互式分析笔记本来探索数据。该数据集适用于多种下游分析场景,例如将定量TME特征与基因组学或临床生存数据关联,以进行生物标志物发现或预后建模;也可用于免疫表型分析、空间生物学研究以及计算病理学新方法的开发。通过Atlas H&E-TME研究访问计划,学者还可申请对自有数据运行相同分析流程,进一步拓展研究的广度与深度。
背景与挑战
背景概述
肿瘤微环境(TME)作为癌症进展、治疗反应及患者预后的核心决定因素,其大规模、一致且定量的表征在常规苏木精-伊红(H&E)染色组织病理学中仍显稀缺。2026年,由Aignostics、柏林夏里特医学院、慕尼黑大学及梅奥诊所等机构的研究团队共同发布了OpenTME数据集。该数据集基于癌症基因组图谱(TCGA)中的3,634张H&E染色全切片图像,涵盖膀胱癌、乳腺癌、结直肠癌、肝癌和肺癌五种癌症类型,通过Atlas H&E-TME人工智能应用系统生成了细胞级分辨率的定量TME图谱。OpenTME旨在为生物标志物发现、空间生物学研究及计算病理学方法开发提供标准化资源,显著降低了H&E图像大规模空间分析的门槛,推动了肿瘤免疫微环境研究的可及性与可重复性。
当前挑战
OpenTME致力于解决肿瘤微环境定量表征中的核心挑战:如何从常规H&E病理切片中提取大规模、高精度的细胞级空间特征以揭示TME的异质性及其与临床结局的关联。在数据集构建过程中,研究团队面临多重技术难题,包括全切片图像的质量控制与组织区域分割的准确性、九类细胞检测与分类的模型泛化能力,以及跨癌症类型和扫描仪差异的数据一致性保障。此外,处理数千张高分辨率图像需要庞大的计算基础设施与高效的算法流水线,而生成超过4,500项定量读数的同时确保其临床可解释性亦需深入的病理学验证与领域知识融合。
常用场景
经典使用场景
在计算病理学领域,OpenTME数据集为肿瘤微环境(TME)的定量研究提供了标准化的分析框架。该数据集通过对TCGA中五种常见癌症类型的3634张H&E染色全切片图像进行AI驱动的预处理,生成了涵盖组织分割、细胞分类及空间邻域分析的超过4500项定量指标。研究人员无需自行部署复杂的深度学习模型,即可直接利用这些高分辨率、单细胞级别的TME特征,开展大规模的生物标志物挖掘、免疫表型分析以及生存模型构建等工作,极大地降低了空间生物学研究的门槛。
解决学术问题
OpenTME有效解决了肿瘤微环境研究中数据生成不一致、计算资源要求高的核心难题。传统上,从H&E切片中提取定量TME特征需要依赖专业的病理学标注、复杂的细胞检测算法以及高昂的计算基础设施,导致许多研究难以实现大规模、可重复的分析。该数据集通过统一的Atlas H&E-TME流程,提供了跨癌症类型、标准化的TME表征,使研究者能够专注于下游科学问题,如探究免疫细胞空间分布与基因组变异的相关性、识别影响预后的微环境模式,以及验证新型计算病理学方法的泛化性能。
实际应用
在临床转化研究中,OpenTME为基于病理图像的精准医疗提供了可直接利用的数据资源。例如,医疗机构或学术团队可借助该数据集中的免疫细胞密度、空间共现特征等指标,开发预测患者治疗反应或生存结局的风险模型。此外,这些标准化的TME特征可与基因组、转录组等多组学数据整合,用于发现新的联合生物标志物或揭示耐药机制。数据集配套的TME Studio交互式分析工具进一步支持用户快速探索数据模式,加速从病理图像到临床见解的转化过程。
数据集最近研究
最新研究方向
在计算病理学领域,肿瘤微环境(TME)的定量解析已成为推动精准医学发展的关键前沿。OpenTME数据集通过整合人工智能驱动的组织分割、细胞检测与分类以及空间邻域分析,为大规模H&E染色全切片图像提供了标准化的TME特征谱。当前研究热点聚焦于利用此类高分辨率数据探索免疫细胞空间分布与患者预后之间的关联,并开发新型生物标志物以优化癌症分型与治疗策略。该数据集的开放共享显著降低了空间生物学研究的门槛,促进了多组学整合分析,为肿瘤免疫治疗响应预测和个体化医疗方案的制定提供了重要资源。
相关研究论文
- 1OpenTME: An Open Dataset of AI-powered H&E Tumor Microenvironment Profiles from TCGAAignostics; 柏林夏里特医学院·病理学研究所; 梅奥诊所·实验室医学与病理学系; 柏林工业大学·机器学习组; 柏林学习与数据基础研究所; 韩国大学·人工智能系; 马克斯·普朗克信息学研究所; 德国癌症研究中心; 慕尼黑大学·病理学研究所; 巴伐利亚癌症研究中心 · 2026年
以上内容由遇见数据集搜集并总结生成



