TCGA-MC3
收藏arXiv2025-09-30 收录
下载链接:
https://gdc.cancer.gov/about-data/publications/mc3-2017
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由多中心癌症突变调用项目(MC3)为TCGA受试者生成的共识体细胞突变数据。每个受试者都被标记为25种癌症类型中的一种。数据集按照癌症类型进行了分层,训练集、验证集和测试集的比例为6:2:2。该数据集涉及6229个通路和18059个基因,涵盖9012名受试者。任务类型为多类别分类。
This dataset consists of consensus somatic mutation data generated for TCGA subjects by the Multi-Center Cancer Mutation Calling (MC3) project. Each subject is labeled as belonging to one of 25 cancer types. The dataset is stratified by cancer type, with a 6:2:2 split for the training, validation, and test sets. It encompasses 6229 biological pathways and 18059 genes, involving a total of 9012 subjects. The task is multi-class classification.
提供机构:
TCGA
搜集汇总
数据集介绍

背景与挑战
背景概述
TCGA-MC3数据集是癌症基因组图谱(TCGA)中多中心突变调用项目的结果,旨在为33种癌症类型的超过10,000个肿瘤-正常外显子对提供全面的体细胞突变调用。该数据集通过集成七种算法和严格过滤,生成了约350万个体细胞变异,支持跨肿瘤类型分析,并作为PanCan Atlas研究的基础资源。
以上内容由遇见数据集搜集并总结生成



