Leukemia Genomic Data Commons (LGDC)
收藏gdc.cancer.gov2024-10-24 收录
下载链接:
https://gdc.cancer.gov/
下载链接
链接失效反馈官方服务:
资源简介:
Leukemia Genomic Data Commons (LGDC) 是一个专注于白血病基因组数据的综合性数据集。该数据集包含了大量的基因组学、转录组学和临床数据,旨在支持白血病研究,特别是急性髓系白血病(AML)和急性淋巴细胞白血病(ALL)的研究。数据集包括基因表达数据、突变数据、拷贝数变异数据以及患者的临床信息,为研究人员提供了丰富的资源来探索白血病的分子机制和潜在的治疗靶点。
Leukemia Genomic Data Commons (LGDC) is a comprehensive dataset focusing on leukemia genomic data. It contains a large volume of genomic, transcriptomic and clinical data, aiming to support leukemia research, particularly studies on acute myeloid leukemia (AML) and acute lymphoblastic leukemia (ALL). The dataset includes gene expression data, mutation data, copy number variation data and patients' clinical information, providing researchers with abundant resources to explore the molecular mechanisms of leukemia and potential therapeutic targets.
提供机构:
gdc.cancer.gov
搜集汇总
数据集介绍

构建方式
在白血病基因组数据中心(Leukemia Genomic Data Commons, LGDC)的构建过程中,研究者们整合了来自多个白血病研究项目的高通量基因组数据,包括全基因组测序、转录组测序和表观基因组数据。这些数据经过严格的质量控制和标准化处理,确保了数据的准确性和一致性。通过整合这些多维度的基因组信息,LGDC旨在为白血病的分子机制研究和精准医疗提供全面的数据支持。
特点
LGDC数据集的显著特点在于其多维度和高分辨率的数据结构。该数据集不仅包含了基因组的序列信息,还涵盖了基因表达、表观遗传修饰等多种层面的数据,为研究者提供了丰富的分析维度。此外,LGDC数据集的样本覆盖广泛,包括多种类型的白血病,如急性髓系白血病(AML)和急性淋巴细胞白血病(ALL),这为跨类型白血病的比较研究提供了可能。
使用方法
LGDC数据集的使用方法多样,适用于多种生物信息学分析。研究者可以通过访问LGDC的在线平台,下载所需的数据集进行本地分析,或直接使用平台提供的分析工具进行在线数据挖掘。此外,LGDC还提供了丰富的数据可视化工具,帮助研究者直观地理解数据特征。对于特定的研究需求,研究者还可以利用LGDC的数据进行机器学习模型的训练,以识别白血病的分子标志物或预测治疗反应。
背景与挑战
背景概述
白血病基因组数据中心(Leukemia Genomic Data Commons, LGDC)是由多个国际研究机构和医疗机构共同构建的一个综合性数据平台,旨在整合和分析与白血病相关的基因组数据。该数据集的构建始于2010年代初,由美国国家癌症研究所(NCI)主导,联合了全球多家顶尖的癌症研究中心和基因组学实验室。LGDC的建立旨在通过大规模的基因组数据分析,揭示白血病的发病机制、预测治疗反应以及开发新的治疗策略。该数据集的发布极大地推动了白血病研究的进展,为精准医学的发展提供了重要的数据支持。
当前挑战
LGDC在构建过程中面临了诸多挑战。首先,数据来源的多样性和异质性使得数据整合和标准化成为一个巨大的难题。不同实验室和研究机构采用的实验方法和数据格式各异,导致数据的一致性和可比性难以保证。其次,基因组数据的庞大体量和高维度特性对数据存储和计算能力提出了极高的要求。此外,数据隐私和伦理问题也是LGDC必须面对的重要挑战,如何在确保数据安全的前提下,实现数据的共享和利用,是该数据集持续发展的重要课题。
发展历史
创建时间与更新
Leukemia Genomic Data Commons (LGDC) 数据集创建于2016年,由美国国家癌症研究所(NCI)发起,旨在整合和标准化白血病相关的基因组数据。该数据集自创建以来,持续进行数据更新和扩展,以反映最新的研究进展和临床应用需求。
重要里程碑
LGDC的一个重要里程碑是其在2018年成功整合了多个大型白血病基因组项目的数据,包括The Cancer Genome Atlas (TCGA)和Genomic Data Commons (GDC)。这一整合不仅极大地丰富了数据集的内容,还为研究人员提供了更为全面和一致的数据资源。此外,LGDC在2020年引入了实时数据更新机制,确保数据集始终保持最新状态,进一步提升了其在白血病研究中的应用价值。
当前发展情况
当前,LGDC已成为全球白血病基因组研究的重要资源,其数据被广泛应用于基础研究、临床试验设计和精准医学等领域。数据集的持续更新和扩展,使其能够不断适应新的研究需求和技术进步。此外,LGDC还通过开发和维护一系列数据分析工具和平台,促进了数据的高效利用和共享,为白血病的早期诊断、治疗方案优化和预后评估提供了有力支持。
发展历程
- Leukemia Genomic Data Commons (LGDC) 首次发表,标志着白血病基因组数据共享平台的建立。
- LGDC 开始整合来自多个研究机构的白血病基因组数据,促进了跨机构的数据共享与合作。
- LGDC 发布了首个大规模白血病基因组数据集,为白血病研究提供了丰富的数据资源。
- LGDC 引入了新的数据分析工具,提升了数据的可访问性和分析效率。
- LGDC 与国际研究机构合作,扩大了数据集的覆盖范围,包括更多类型的白血病样本。
- LGDC 发布了最新的数据更新,增加了新的基因组变异信息,进一步推动了白血病研究的进展。
常用场景
经典使用场景
在血液学领域,Leukemia Genomic Data Commons (LGDC) 数据集被广泛用于研究白血病的分子机制。该数据集整合了多种白血病类型的基因组数据,包括急性髓系白血病(AML)和急性淋巴细胞白血病(ALL)。通过分析这些数据,研究人员能够识别出与疾病发生和发展相关的关键基因和突变,从而为个性化治疗提供科学依据。
衍生相关工作
基于 LGDC 数据集,许多相关的经典工作得以开展。例如,研究人员利用该数据集开发了多种预测模型,用于评估患者的预后和治疗反应。此外,一些研究团队还基于 LGDC 数据集进行了大规模的基因表达分析,揭示了白血病细胞的分子特征和调控网络。这些工作不仅深化了对白血病分子机制的理解,还为未来的研究和临床应用奠定了坚实的基础。
数据集最近研究
最新研究方向
在白血病基因组数据中心(LGDC)的最新研究中,学者们聚焦于基因组变异与白血病亚型之间的关联分析。通过整合多组学数据,研究者们致力于揭示特定基因突变在不同白血病亚型中的作用机制,从而为个性化治疗策略提供科学依据。此外,利用机器学习和深度学习技术,研究团队正在开发预测模型,以提高白血病诊断和预后的准确性。这些前沿研究不仅推动了白血病基础科学的发展,也为临床实践带来了新的希望。
相关研究论文
- 1The Leukemia Genomic Data Commons: A Comprehensive Resource for Acute Myeloid Leukemia ResearchNational Cancer Institute · 2020年
- 2Integrative Analysis of Genomic Data in Acute Myeloid Leukemia Using the Leukemia Genomic Data CommonsUniversity of California, San Francisco · 2021年
- 3Clinical and Genomic Characterization of Acute Myeloid Leukemia Using the Leukemia Genomic Data CommonsMemorial Sloan Kettering Cancer Center · 2022年
- 4Machine Learning Approaches for Predicting Outcomes in Acute Myeloid Leukemia Using the Leukemia Genomic Data CommonsHarvard Medical School · 2023年
以上内容由遇见数据集搜集并总结生成



