five

Genomic Data Commons (GDC)

收藏
portal.gdc.cancer.gov2024-10-28 收录
下载链接:
https://portal.gdc.cancer.gov/
下载链接
链接失效反馈
官方服务:
资源简介:
Genomic Data Commons (GDC) 是一个综合性的数据平台,旨在统一和标准化癌症基因组数据。它提供了对多种癌症类型的基因组、表观基因组和转录组数据的访问,包括但不限于突变、拷贝数变异、甲基化数据和RNA测序数据。GDC还支持数据的下载、分析和可视化,帮助研究人员进行癌症研究。

Genomic Data Commons (GDC) is a comprehensive data platform aimed at unifying and standardizing cancer genomic data. It provides access to genomic, epigenomic, and transcriptomic data across multiple cancer types, including but not limited to mutation data, copy number variation data, methylation data, and RNA sequencing data. GDC also supports data downloading, analysis, and visualization, assisting researchers in conducting cancer research.
提供机构:
portal.gdc.cancer.gov
搜集汇总
数据集介绍
main_image_url
构建方式
Genomic Data Commons (GDC) 数据集的构建基于大规模的基因组和临床数据,涵盖了多种癌症类型的样本。该数据集通过整合来自不同研究项目和临床试验的数据,采用标准化和质量控制流程,确保数据的准确性和一致性。GDC 利用先进的生物信息学工具和技术,对基因组、转录组和表观遗传数据进行深度分析,从而构建了一个全面且高质量的癌症基因组数据库。
特点
GDC 数据集的特点在于其广泛性和深度。它包含了来自多种癌症类型的基因组数据,涵盖了从基因突变到表观遗传变化的多个层面。此外,GDC 提供了详细的临床信息,使得研究人员能够将基因组数据与患者的临床结果相关联。数据集的开放性和可访问性也是其显著特点,研究人员可以通过统一的接口访问和下载数据,极大地促进了跨机构和跨学科的合作研究。
使用方法
使用 GDC 数据集时,研究人员首先需要注册并获取访问权限。通过 GDC 的在线平台,用户可以搜索和筛选符合其研究需求的特定数据集。下载数据后,研究人员可以使用各种生物信息学工具和软件进行进一步的分析,如基因突变分析、表达谱分析和生存分析等。GDC 还提供了丰富的文档和教程,帮助用户理解和处理数据,确保研究结果的可靠性和科学性。
背景与挑战
背景概述
基因组数据中心(Genomic Data Commons, GDC)是由美国国家癌症研究所(National Cancer Institute, NCI)于2016年创建的一个综合性数据平台,旨在整合和标准化癌症基因组数据。GDC的核心研究问题是如何通过大规模基因组数据的整合与分析,推动癌症研究和临床应用的发展。该数据集涵盖了多种癌症类型的基因组、表观基因组和转录组数据,为研究人员提供了丰富的资源,极大地促进了癌症生物学和精准医学的研究进展。
当前挑战
尽管GDC在癌症研究领域具有重要影响力,但其构建和应用过程中仍面临诸多挑战。首先,数据的标准化和整合是一个复杂的过程,涉及不同数据类型和来源的统一处理,这要求高度的技术能力和资源投入。其次,数据的安全性和隐私保护是GDC必须面对的重要问题,尤其是在涉及患者基因信息的情况下,如何确保数据的安全和合规使用是一个持续的挑战。此外,数据的访问和分析工具的易用性也是GDC需要不断改进的方面,以确保研究人员能够高效地利用这些宝贵的资源。
发展历史
创建时间与更新
Genomic Data Commons (GDC) 数据集由美国国家癌症研究所(NCI)于2016年正式推出,旨在整合和标准化癌症基因组数据。自推出以来,GDC持续进行数据更新和功能扩展,以适应不断发展的基因组学研究需求。
重要里程碑
GDC的一个重要里程碑是其在2017年实现了对TCGA(The Cancer Genome Atlas)数据的全面整合,这一举措极大地促进了癌症基因组数据的共享和分析。随后,GDC在2018年引入了对多种癌症类型的全面支持,包括但不限于乳腺癌、肺癌和结直肠癌,进一步丰富了数据集的内容和多样性。此外,GDC在2020年推出了数据下载和分析工具的重大更新,显著提升了用户的数据访问和处理效率。
当前发展情况
当前,GDC数据集已成为全球癌症基因组研究的重要资源,其数据涵盖了多种癌症类型的基因组、转录组和表观基因组数据。GDC不仅提供了丰富的数据资源,还通过其强大的数据分析工具和平台,支持了众多癌症研究项目和临床应用。GDC的发展对癌症基因组学领域的进步起到了关键作用,推动了从基础研究到临床应用的转化,为癌症的精准治疗和预防提供了坚实的数据基础。
发展历程
  • Genomic Data Commons (GDC) 由美国国家癌症研究所 (NCI) 首次发布,旨在统一和标准化癌症基因组数据的管理和共享。
    2016年
  • GDC 开始整合来自多个癌症基因组项目的原始数据,包括 The Cancer Genome Atlas (TCGA) 和 Therapeutically Applicable Research to Generate Effective Treatments (TARGET) 项目。
    2017年
  • GDC 引入了新的数据分析工具和可视化功能,增强了用户对癌症基因组数据的理解和利用。
    2018年
  • GDC 开始支持大规模数据下载和批量数据处理,进一步提升了数据的可访问性和利用效率。
    2019年
  • GDC 扩展了其数据集,包括了更多的癌症类型和基因组数据,为癌症研究提供了更丰富的资源。
    2020年
  • GDC 推出了新的数据标准化和质量控制流程,确保数据的高质量和一致性,支持更精确的癌症研究。
    2021年
常用场景
经典使用场景
在基因组学研究领域,Genomic Data Commons (GDC) 数据集被广泛用于癌症基因组分析。该数据集整合了来自多种癌症类型的基因组、表观基因组和转录组数据,为研究人员提供了丰富的资源。通过GDC,研究者可以深入探索癌症的分子机制,识别潜在的治疗靶点,并开发个性化的治疗策略。
解决学术问题
GDC数据集解决了癌症研究中的多个关键学术问题。首先,它提供了大规模、高质量的基因组数据,有助于揭示癌症的遗传变异和表观遗传调控机制。其次,通过整合多维度的生物数据,GDC促进了跨学科研究,推动了癌症生物学和临床医学的进步。此外,GDC还支持了癌症基因组图谱的构建,为全球癌症研究提供了重要的参考。
衍生相关工作
GDC数据集的发布和应用催生了大量相关的经典工作。例如,基于GDC数据的研究揭示了多种癌症的分子特征和驱动基因,推动了癌症分类和治疗策略的优化。此外,GDC还促进了多中心合作研究,形成了全球性的癌症基因组数据库,为后续研究提供了坚实的基础。通过GDC,基因组学研究得以深入和扩展,为癌症研究和治疗带来了革命性的变化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作