five

The Cancer Genome Atlas (TCGA)

收藏
www.cancer.gov2025-03-04 收录
下载链接:
https://www.cancer.gov/ccg/research/genome-sequencing/tcga
下载链接
链接失效反馈
官方服务:
资源简介:
The Cancer Genome Atlas (TCGA) 是一个由美国国家癌症研究所(NCI)和国家人类基因组研究所共同发起的大型癌症基因组学项目,旨在对多种癌症类型的肿瘤样本和匹配的正常样本进行分子特征分析。该项目自2006年开始,至今已生成了超过2.5PB的基因组学、表观基因组学、转录组学和蛋白质组学数据,这些数据对癌症的诊断、治疗和预防具有重要意义,并且可以通过Genomic Data Commons Data Portal公开访问。TCGA项目不仅推动了癌症研究的发展,还为后续的泛癌症研究提供了宝贵的数据资源和分析工具。

The Cancer Genome Atlas (TCGA) is a large-scale cancer genomics project jointly initiated by the U.S. National Cancer Institute (NCI) and the National Human Genome Research Institute. It aims to conduct molecular characterization analysis of tumor samples and matched normal samples across multiple cancer types. Launched in 2006, the project has generated over 2.5 petabytes of genomics, epigenomics, transcriptomics and proteomics data to date. These data are of great significance for cancer diagnosis, treatment and prevention, and are publicly accessible via the Genomic Data Commons Data Portal. The TCGA project not only promoted the development of cancer research, but also provided valuable data resources and analytical tools for subsequent pan-cancer research.
提供机构:
www.cancer.gov
搜集汇总
数据集介绍
main_image_url
构建方式
The Cancer Genome Atlas(TCGA)数据集的构建,是通过收集来自全球各地研究机构的癌症样本,运用高通量基因组学技术,如全基因组测序、基因表达分析、拷贝数变异分析等,进行全面的分子层面数据采集。这一过程确保了数据的多样性与全面性,为后续的癌症研究提供了坚实基础。
特点
TCGA数据集的特点在于其包含了丰富的癌症类型,覆盖了超过30种不同的肿瘤类型,每种肿瘤类型都拥有成百上千个样本。数据集不仅包含了基因组的结构变异信息,还包括了基因表达、甲基化等表观遗传学数据。这些多维度的数据使得TCGA成为了癌症研究中不可或缺的资源。
使用方法
使用TCGA数据集,研究者可以首先在数据门户网站上进行数据搜索和下载。数据的使用需遵循相应的伦理规范和数据使用协议。研究者可以利用生物信息学工具对数据进行分析,如基因表达数据分析、生存分析等,以探索癌症的分子机制和生物标志物的发现。此外,TCGA数据集也支持整合其他来源的数据,以进行更深入的跨数据集研究。
背景与挑战
背景概述
在癌症研究的深邃领域,The Cancer Genome Atlas(TCGA)作为一项划时代的科研项目,由美国国家癌症研究所(National Cancer Institute, NCI)和美国国家基因组研究所(National Human Genome Research Institute, NHGRI)于2006年共同发起。该数据集致力于构建一个涵盖多种癌症类型的基因组、转录组、蛋白质组和表观遗传学数据的大型数据库,旨在探索癌症发生的分子机制,为癌症的精准医疗提供科学依据。TCGA的创建不仅极大推动了癌症基因组学的研究,也为后续的癌症精准治疗策略制定提供了宝贵的数据资源。
当前挑战
TCGA数据集在构建和应用过程中面临了诸多挑战。首先,数据的采集与整合过程中涉及到的数据量巨大,数据的标准化和质量控制是首要解决的问题。其次,多维度数据的整合分析需要复杂的生物信息学方法,这为数据挖掘带来了巨大挑战。再者,隐私保护和数据共享的问题也是TCGA数据集面临的重要挑战,如何在保护患者隐私的同时,最大程度地促进数据共享,是科研人员必须考虑的问题。此外,如何将海量的基因组数据转化为临床实践中有效的治疗策略,亦是当前癌症精准医疗领域的重要挑战。
发展历史
创建时间与更新
The Cancer Genome Atlas(TCGA)数据集创建于2006年,其旨在通过高通量基因组学技术,全面收集多种癌症类型的基因表达、突变和拷贝数变异数据。该数据集自创建以来,不断更新和完善,直至2013年完成主要数据收集工作,后续仍有数据补充,但其主要影响和利用已在此阶段形成。
重要里程碑
TCGA的发展历程中,标志性的里程碑事件包括:2006年项目启动,标志着癌症研究进入全面基因组时代;2010年发布第一份数据集,为癌症研究提供了宝贵的资源;2013年数据集主体完成,极大地推进了癌症基因组的认识和理解。这些事件不仅代表了技术进步,也体现了国际合作与共享精神。
当前发展情况
当前,TCGA数据集已成为癌症基因组研究的重要基石,其数据被广泛应用于癌症的生物学机制研究、诊断标志物的发现以及治疗策略的开发。该数据集持续促进着精准医疗的发展,对于提升癌症治疗效率和改善患者预后具有深远影响。
发展历程
  • The Cancer Genome Atlas (TCGA)项目启动,由美国国家癌症研究所(National Cancer Institute, NCI)和美国国家人类基因组研究所(National Human Genome Research Institute, NHGRI)共同发起。
    2006年
  • TCGA发表了首个肿瘤类型——肺癌的数据集。
    2008年
  • TCGA发布了全面的基因组数据,包括基因表达、拷贝数变异和突变信息,涵盖了多种癌症类型。
    2012年
  • TCGA项目扩展,增加了更多的癌症类型和样本。
    2013年
  • TCGA完成了其核心目标,发布了超过10,000个癌症样本的综合基因组数据。
    2015年
  • TCGA数据集被整合入Genomic Data Commons (GDC),为研究人员提供了一个统一的门户来访问和分析TCGA数据。
    2018年
常用场景
经典使用场景
在肿瘤基因组学研究中,The Cancer Genome Atlas(TCGA)数据集被广泛用于挖掘癌症相关的基因变异模式和生物标志物。该数据集集合了来自多种癌症类型的基因表达、突变及拷贝数变异等综合信息,研究人员常利用其进行生存分析、药物反应预测及肿瘤亚型分类。
衍生相关工作
基于TCGA数据集的研究衍生了众多经典工作,包括癌症驱动基因的识别、肿瘤免疫特征的研究、药物靶点发现等。这些工作不仅推动了癌症基因组学的进展,还为后续的转化研究和临床应用奠定了坚实基础。
数据集最近研究
最新研究方向
在生物信息学领域,The Cancer Genome Atlas (TCGA)数据集作为癌症基因组研究的宝库,近期研究方向聚焦于深度学习在肿瘤异质性分析中的应用,以及免疫基因组学在癌症免疫治疗中的关键作用。研究者通过TCGA数据,探索肿瘤微环境与患者预后的关系,为精准医疗提供了重要的生物学基础。此外,该数据集在COVID-19与癌症关系的研究中也扮演了重要角色,揭示了疫情期间癌症患者的风险因素和潜在治疗靶点。
相关研究论文
  • 1
    The Cancer Genome Atlas Pan-Cancer Analysis ProjectNational Cancer Institute · 2013年
  • 2
    Comprehensive Genomic Characterization of Human Glioblastoma MultiformeThe Cancer Genome Atlas Research Network · 2008年
  • 3
    Genomic and Epigenomic Landscapes of Adult Malignant GliomaThe Cancer Genome Atlas Research Network · 2015年
  • 4
    The Genomic and Transcriptomic Architecture of 2,000 Pan-Cancer SamplesThe Cancer Genome Atlas Research Network · 2017年
  • 5
    Genomic Analysis of Non-Small Cell Lung Cancer in WomenThe Cancer Genome Atlas Research Network · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作