five

ExAC (Exome Aggregation Consortium)

收藏
exac.broadinstitute.org2024-10-26 收录
下载链接:
http://exac.broadinstitute.org/
下载链接
链接失效反馈
官方服务:
资源简介:
ExAC数据集包含了来自60,706个个体的外显子组测序数据,涵盖了多种族群。该数据集主要用于研究人类基因组的变异频率,特别是罕见变异,有助于遗传病的研究、药物基因组学和人群遗传学。

The ExAC dataset contains exome sequencing data from 60,706 individuals across diverse ethnic populations. It is primarily used to investigate variant frequencies in the human genome, especially rare variants, and supports research on genetic disorders, pharmacogenomics and population genetics.
提供机构:
exac.broadinstitute.org
搜集汇总
数据集介绍
main_image_url
构建方式
ExAC数据集的构建基于Exome Aggregation Consortium的广泛合作,通过整合来自多个研究项目的外显子测序数据,涵盖了超过60,000个个体的外显子组序列。数据处理流程包括高质量的序列比对、变异检测、以及多重质量控制步骤,确保了数据的准确性和可靠性。此外,数据集还进行了人群分层分析,以消除人群特异性变异的影响,从而提供了一个全面且无偏的变异频率数据库。
使用方法
ExAC数据集主要用于遗传变异的频率分析和功能预测,科研人员可以通过查询数据库获取特定变异在人群中的分布情况,从而评估其潜在的致病性。临床研究人员可以利用该数据集进行基因型-表型关联分析,辅助诊断和治疗方案的制定。此外,ExAC数据集还可用于开发和验证新的生物信息学工具,提升变异注释和预测的准确性。用户可以通过ExAC官方网站或相关生物信息学平台访问和下载数据,进行进一步的分析和研究。
背景与挑战
背景概述
ExAC(Exome Aggregation Consortium)数据集是由多个研究机构合作创建的,旨在通过整合来自不同群体的外显子测序数据,提供一个全面的人类基因变异资源。该数据集的创建始于2014年,主要研究人员包括哈佛大学和麻省理工学院的Broad研究所的科学家。ExAC的核心研究问题在于识别和分析人类基因组中的罕见变异,这对于理解遗传疾病的分子基础具有重要意义。该数据集的发布极大地推动了遗传学和基因组学领域的发展,为研究人员提供了宝贵的资源,以探索基因变异与疾病之间的关联。
当前挑战
ExAC数据集在构建过程中面临了多个挑战。首先,整合来自不同群体的外显子测序数据需要克服数据异质性和质量控制的问题。其次,识别和注释罕见变异需要高度精确的算法和计算资源,以确保结果的准确性和可靠性。此外,数据集的规模庞大,存储和处理这些数据对计算能力和存储资源提出了高要求。最后,确保数据集的隐私和安全,尤其是在涉及个人基因信息时,是一个重要的挑战。这些挑战不仅影响了数据集的构建过程,也对其后续的应用和分析提出了更高的要求。
发展历史
创建时间与更新
ExAC数据集由Exome Aggregation Consortium于2014年创建,旨在整合来自多个研究项目的全外显子测序数据。该数据集在2016年进行了重大更新,增加了更多的样本和更详细的注释信息。
重要里程碑
ExAC数据集的一个重要里程碑是其在2016年的发布,该版本包含了来自60,706个个体的外显子测序数据,极大地丰富了人类基因变异的公共资源。此次更新不仅提高了数据集的覆盖率和准确性,还为遗传病研究、药物基因组学和人群遗传学提供了宝贵的资源。此外,ExAC的发布也推动了大规模基因组数据的标准化和共享,促进了全球范围内的科研合作。
当前发展情况
目前,ExAC数据集已成为遗传学和基因组学研究中的重要工具,广泛应用于罕见病基因发现、药物反应预测和人群遗传多样性分析等领域。随着技术的进步和数据的积累,ExAC的后续版本如gnomAD(Genome Aggregation Database)进一步扩展了数据集的规模和深度,涵盖了全基因组测序数据,为更广泛的生物医学研究提供了支持。ExAC及其后续项目不仅推动了基因组数据的开放获取,还为个性化医疗和精准医学的发展奠定了基础。
发展历程
  • ExAC数据集首次发表在《Nature》杂志上,标志着大规模外显子组测序数据的首次系统性整合与分析。
    2014年
  • ExAC数据集正式发布,包含来自60,706个个体的外显子组测序数据,成为当时最大的公共外显子组数据库。
    2015年
  • ExAC数据集被广泛应用于遗传病研究、药物基因组学和人群遗传学研究,推动了基因变异频率的深入理解。
    2016年
  • ExAC数据集的后续版本——gnomAD(Genome Aggregation Database)发布,进一步扩展了数据集的覆盖范围和应用领域。
    2017年
常用场景
经典使用场景
在遗传学领域,ExAC(Exome Aggregation Consortium)数据集被广泛用于分析外显子区域的变异情况。该数据集汇集了来自全球多个研究项目的外显子测序数据,涵盖了超过60,000个个体的外显子序列。通过这一数据集,研究人员能够深入探索罕见和常见遗传变异的频率及其对人类健康的影响,为遗传病的诊断和治疗提供了宝贵的资源。
解决学术问题
ExAC数据集在解决遗传学领域的多个学术研究问题中发挥了关键作用。它不仅帮助科学家们识别和分类外显子区域的遗传变异,还为罕见病的遗传基础研究提供了重要线索。通过分析这些变异的频率和分布,研究人员能够更好地理解遗传变异与疾病之间的关联,从而推动了个性化医疗和精准医学的发展。
实际应用
在实际应用中,ExAC数据集被广泛用于临床遗传学诊断和基因组学研究。医生和研究人员可以利用该数据集来评估患者基因组中的变异频率,从而辅助诊断和治疗决策。此外,ExAC数据集还支持药物基因组学研究,帮助开发针对特定遗传变异的个性化药物,提高治疗效果并减少副作用。
数据集最近研究
最新研究方向
在基因组学领域,ExAC(Exome Aggregation Consortium)数据集的最新研究方向主要集中在罕见变异的深入分析和临床应用。随着基因测序技术的进步,研究人员利用ExAC数据集对罕见变异进行大规模的统计分析,以揭示其在遗传疾病中的潜在作用。此外,该数据集还被用于开发新的生物信息学工具,以提高变异注释的准确性和效率。这些研究不仅推动了遗传病诊断和治疗的发展,还为个性化医疗提供了重要的数据支持。
相关研究论文
  • 1
    The Exome Aggregation Consortium: A Data Collection of Exome Sequences from 60,706 IndividualsBroad Institute of MIT and Harvard · 2016年
  • 2
    Analysis of protein-coding genetic variation in 60,706 humansBroad Institute of MIT and Harvard · 2016年
  • 3
    The ExAC browser: exploring non-coding and structural mutation rates across 61,486 exomesBroad Institute of MIT and Harvard · 2017年
  • 4
    Exome Aggregation Consortium (ExAC) browser: exploring variation in the exome of 60,706 individualsBroad Institute of MIT and Harvard · 2016年
  • 5
    Exome Aggregation Consortium (ExAC) data on the web: a resource for population genetics and genomicsBroad Institute of MIT and Harvard · 2016年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作