five

The Cancer Genome Atlas (TCGA) - Leukemia|白血病数据集|基因组学数据集

收藏
portal.gdc.cancer.gov2024-10-24 收录
白血病
基因组学
下载链接:
https://portal.gdc.cancer.gov/
下载链接
链接失效反馈
资源简介:
该数据集包含了白血病患者的基因组数据,包括基因表达、突变、拷贝数变异、甲基化等多种类型的数据。
提供机构:
portal.gdc.cancer.gov
AI搜集汇总
数据集介绍
main_image_url
构建方式
The Cancer Genome Atlas (TCGA) - Leukemia数据集的构建基于大规模的基因组学研究,涵盖了多种白血病亚型的详细基因组数据。通过高通量测序技术,研究人员对白血病患者的基因组进行了全面的分析,包括基因表达、突变、拷贝数变异和表观遗传学修饰等多个层面。这些数据经过严格的质控和标准化处理,确保了数据的高质量和一致性。
特点
该数据集的显著特点在于其全面性和深度。它不仅包含了白血病患者的基因组信息,还整合了临床数据,如患者的生存状态、治疗反应等,为研究白血病的分子机制和临床预后提供了宝贵的资源。此外,数据集的高维度特性使其适用于多种生物信息学分析,如机器学习模型的训练和验证。
使用方法
使用TCGA - Leukemia数据集时,研究人员可以首先根据研究目的选择合适的基因组数据类型,如基因表达矩阵或突变谱。随后,通过数据预处理步骤,如归一化和特征选择,准备数据用于进一步分析。常见的应用包括基因表达差异分析、生存分析和机器学习模型的构建。此外,数据集的开放获取特性使得全球的研究人员都能利用这一资源进行白血病相关的研究。
背景与挑战
背景概述
The Cancer Genome Atlas (TCGA) - Leukemia数据集,作为癌症基因组图谱项目的一部分,由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)于2006年启动。该数据集汇集了大量急性髓系白血病(AML)和急性淋巴细胞白血病(ALL)的基因组、转录组和表观遗传学数据,旨在揭示白血病的发病机制和潜在治疗靶点。主要研究人员包括Matthew Meyerson、Gad Getz和Lynda Chin等,他们的工作极大地推动了白血病基因组学的研究进展,为个性化医疗提供了宝贵的资源。
当前挑战
尽管TCGA - Leukemia数据集在白血病研究中具有重要价值,但其构建和应用过程中仍面临诸多挑战。首先,数据的高维度与复杂性使得数据分析和解读变得极为困难,需要先进的生物信息学工具和算法。其次,样本的异质性导致基因表达和突变模式的差异,增加了疾病分类和预后的不确定性。此外,数据的标准化和整合问题也限制了其在临床实践中的广泛应用。这些挑战不仅影响了数据的有效利用,也提出了对更强大分析方法和跨学科合作的迫切需求。
发展历史
创建时间与更新
The Cancer Genome Atlas (TCGA) - Leukemia数据集创建于2006年,由美国国家癌症研究所(NCI)和美国国家人类基因组研究所(NHGRI)共同发起。该数据集的最新更新时间截至2018年,涵盖了多种白血病类型的基因组数据。
重要里程碑
TCGA - Leukemia数据集的重要里程碑包括2012年发布的初步研究结果,揭示了白血病基因组的多层次复杂性,为个性化治疗提供了基础。2013年,该数据集被广泛应用于白血病亚型的分类和预后模型的构建,显著提升了临床诊断和治疗的精准度。2016年,TCGA - Leukemia数据集的全面分析报告发表,标志着其在白血病研究中的核心地位。
当前发展情况
当前,TCGA - Leukemia数据集已成为白血病研究的重要资源,推动了基因组学、转录组学和蛋白质组学等多领域的交叉研究。该数据集不仅促进了白血病分子机制的深入理解,还为新型治疗策略的开发提供了关键数据支持。此外,TCGA - Leukemia数据集的开放获取政策,极大地促进了全球科研合作,加速了白血病研究的进展,对提升患者生存率和治疗效果具有深远意义。
发展历程
  • The Cancer Genome Atlas (TCGA)项目正式启动,旨在通过大规模基因组分析揭示癌症的复杂性。
    2006年
  • TCGA项目开始收集和分析白血病(Leukemia)样本,标志着TCGA-Leukemia数据集的初步形成。
    2008年
  • TCGA-Leukemia数据集首次公开发布,提供了关于急性髓系白血病(AML)和急性淋巴细胞白血病(ALL)的详细基因组数据。
    2012年
  • TCGA-Leukemia数据集在多个国际会议上被广泛讨论,促进了白血病基因组学研究的进展。
    2013年
  • TCGA-Leukemia数据集被应用于多项研究,揭示了白血病中的关键基因突变和分子机制。
    2015年
  • TCGA-Leukemia数据集的更新版本发布,包含了更多的样本和更详细的分子数据,进一步推动了白血病的精准医学研究。
    2018年
常用场景
经典使用场景
在癌症基因组学领域,The Cancer Genome Atlas (TCGA) - Leukemia数据集被广泛用于白血病基因组变异的研究。该数据集包含了大量白血病患者的基因组、转录组和表观遗传学数据,为研究人员提供了丰富的资源,以探索白血病的发病机制和分子特征。通过分析这些数据,研究者能够识别出与白血病相关的关键基因和突变,从而为疾病的诊断和治疗提供新的视角。
衍生相关工作
基于TCGA - Leukemia数据集,许多相关的经典工作得以开展。例如,研究者利用该数据集识别出了多种白血病亚型,并揭示了不同亚型之间的分子差异,这为白血病的分类和治疗策略提供了新的思路。此外,该数据集还促进了多组学整合分析方法的发展,通过整合基因组、转录组和表观遗传学数据,研究者能够更全面地理解白血病的复杂性。这些衍生工作不仅丰富了白血病研究的理论基础,也为临床实践提供了有力的支持。
数据集最近研究
最新研究方向
在癌症基因组学领域,The Cancer Genome Atlas (TCGA) - Leukemia数据集的最新研究方向主要集中在白血病亚型的精准分类与分子机制解析。研究者们利用该数据集中的多维度基因组信息,结合机器学习和深度学习技术,致力于开发更为精确的诊断和预后模型。此外,针对白血病细胞的基因突变、表观遗传修饰及转录调控网络的深入研究,揭示了不同亚型间的分子差异及其对治疗反应的影响,为个性化医疗策略的制定提供了科学依据。
相关研究论文
  • 1
    The Cancer Genome Atlas (TCGA) Research Network. Comprehensive molecular portraits of human breast tumours.The Cancer Genome Atlas Research Network · 2012年
  • 2
    Genomic and epigenomic landscapes of adult de novo acute myeloid leukemia.The Cancer Genome Atlas Research Network · 2013年
  • 3
    The Cancer Genome Atlas Pan-Cancer analysis project.The Cancer Genome Atlas Research Network · 2013年
  • 4
    Integrated genomic characterization of adult myeloid malignancies.The Cancer Genome Atlas Research Network · 2017年
  • 5
    The Cancer Genome Atlas Comprehensive Molecular Characterization of Renal Cell Carcinoma.The Cancer Genome Atlas Research Network · 2013年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录

CAP-DATA

CAP-DATA数据集由长安大学交通学院的研究团队创建,包含11,727个交通事故视频,总计超过2.19百万帧。该数据集不仅标注了事故发生的时间窗口,还提供了详细的文本描述,包括事故前的实际情况、事故类别、事故原因和预防建议。数据集的创建旨在通过结合视觉和文本信息,提高交通事故预测的准确性和解释性,从而支持更安全的驾驶决策系统。

arXiv 收录