five

The Allen Ancient DNA Resource (AADR): A curated compendium of ancient human genomes

收藏
DataCite Commons2025-04-02 更新2025-04-15 收录
下载链接:
https://dataverse.harvard.edu/citation?persistentId=doi:10.7910/DVN/FFIDCW
下载链接
链接失效反馈
官方服务:
资源简介:
The Allen Ancient DNA Resource (AADR) seeks to provide a publicly available, uniformly curated dataset that is maximally useful for scientists carrying out analyses of population history and natural selection. The dataset consists of thousands of ancient and present-day individuals genotyped at up to 1.23 million positions in the genome (in hg19 coordinates). <br><br> The genotypes in the AADR are not a perfect match to those from the associated published papers. To make it easier to co-analyze datasets, we have started from bam or fastq files; trimmed the ends of sequences to reduce errors due to ancient DNA damage in a way that is largely uniform across datasets and may be slightly different from that used in the individual publications; and determined genotypes anew by sampling a random sequence to cover each position. <br><br> Researchers who wish to use this compilation should provide two citations. The first should be to the Dataverse page and the specific version of AADR they use as the basis of their analyses (e.g. version 9, the September 16 2024 release, as in the example below). The second should be to the manuscript describing AADR. <br><br> (1) "Swapan Mallick and David Reich: The Allen Ancient DNA Resource (AADR): A curated compendium of ancient human genomes, https://doi.org/10.7910/DVN/FFIDCW”, Harvard Dataverse, V9 data release [September 16, 2024]." <br><br> (2) "Mallick S, Micco A, Mah M, Ringbauer H, Lazaridis I, Olalde I, Patterson N, Reich D (2024) The Allen Ancient DNA Resource (AADR) a curated compendium of ancient human genomes. Sci Data 11, 182." <br><br> Citing the AADR is not a substitute for citing the original papers that produced the component data, which must be specifically referenced in each publication that uses data from them. <br><br> We aim to update and enhance this resource every couple of months to make the releases maximally useful to the community. We rely on feedback from the user community to improve the AADR, so please write jointly to Swapan Mallick (swapan_mallick@hms.harvard.edu) and David Reich (reich@genetics.med.harvard.edu) if you identify errors or other issues. <br><br> The first version of AADR was made publicly on February 22 2019 via the Reich laboratory website at Harvard Medical School, which hosted a total of six primary releases. All releases are now copied to Dataverse which has the virtue of including a permanent digital object identifier (doi) that can be cited in a straightforward way, and data access not tied to the website of a Principal Investigator. Below is a translation from the versions on the Reich laboratory website to the Dataverse versions. <br><br> V62.0 (Dataverse 9.0) September 16 2024 <br> V54.1.p1 (Dataverse 8.0) March 6 2023 <br> V54.1 (Dataverse 7.0) Nov 16 2022 <br> V52.2 (Dataverse 6.0) Aug 22 2022 <br> V50.0.p1 (Dataverse 5.0) Aug 1 2022 <br> V50.0 (Dataverse 4.0) Oct 10 2021 <br> V44.3 (Dataverse 3.0) Jan 20 2021 <br> V42.4 (Dataverse 2.0) Mar 25 2020 <br> V37.2 (Dataverse 1.0) Feb 22 2019 <br><br> We thank the John Templeton Foundation, a grant from the National Institutes of Health, the Howard Hughes Medical Institute, and the Allen Discovery Center program, a Paul G. Allen Frontiers Group advised program of the Paul G. Allen Family Foundation, for providing the resources needed to create and update this dataset.

艾伦古代DNA资源(Allen Ancient DNA Resource,AADR)旨在为开展群体历史与自然选择分析的科研人员,提供一套公开可用、经统一审核整理的高实用性数据集。该数据集包含数千名古代及当代个体的基因分型数据,覆盖基因组中多达123万个位点(采用hg19基因组坐标体系)。 AADR中的基因型数据与对应已发表论文中的原始基因型并非完全一致。为便于多数据集联合分析,我们以BAM或FASTQ文件为起始数据,对序列末端进行修剪以降低古DNA损伤带来的误差——该处理流程在各数据集间保持基本统一,且与单篇原始文献中采用的方法可能存在细微差异;随后通过随机抽样覆盖每个位点的序列,重新确定各位点的基因型。 希望使用该整合数据集的研究人员需引用两篇文献。第一篇需引用其所使用的Dataverse页面及对应AADR版本(例如2024年9月16日发布的V9版本,如下示例)。第二篇需引用描述AADR的学术论文。 (1) “Swapan Mallick 与 David Reich:《艾伦古代DNA资源(AADR):古人类基因组经审核整理的整合数据集》,哈佛Dataverse,V9数据版本[2024年9月16日],https://doi.org/10.7910/DVN/FFIDCW” (2) Mallick S, Micco A, Mah M, Ringbauer H, Lazaridis I, Olalde I, Patterson N, Reich D(2024)《艾伦古代DNA资源(AADR):古人类基因组经审核整理的整合数据集》,《科学数据》(Sci Data),11卷,182页。 引用AADR并不能替代引用生成各组分数据的原始文献,使用其中数据的每一篇发表论文都需专门标注这些原始文献。 我们计划每数月更新并优化该资源,以确保发布版本对科研社区具有最高实用性。我们依托用户社区的反馈来改进AADR,若您发现任何错误或其他问题,请同时致信Swapan Mallick(swapan_mallick@hms.harvard.edu)与David Reich(reich@genetics.med.harvard.edu)。 AADR首个版本于2019年2月22日通过哈佛医学院Reich实验室官网公开,该官网共发布过6个主要版本。目前所有版本均已迁移至Dataverse,其优势在于包含可直接引用的永久数字对象标识符(DOI),且数据访问不再依赖某一位首席研究员的个人网站。下文为Reich实验室官网版本与Dataverse版本的对应关系: V62.0(Dataverse 9.0) 2024年9月16日 V54.1.p1(Dataverse 8.0) 2023年3月6日 V54.1(Dataverse 7.0) 2022年11月16日 V52.2(Dataverse 6.0) 2022年8月22日 V50.0.p1(Dataverse 5.0) 2022年8月1日 V50.0(Dataverse 4.0) 2021年10月10日 V44.3(Dataverse 3.0) 2021年1月20日 V42.4(Dataverse 2.0) 2020年3月25日 V37.2(Dataverse 1.0) 2019年2月22日 我们感谢约翰·坦普尔顿基金会、美国国立卫生研究院拨款、霍华德·休斯医学研究所,以及保罗·G·艾伦家族基金会旗下、由保罗·G·艾伦前沿小组管理的艾伦发现中心项目,感谢其为创建和更新本数据集提供所需的资源支持。
提供机构:
Harvard Dataverse
创建时间:
2023-03-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AADR是一个公开的、经过统一整理的古代和现代人类基因组数据集,包含数千个个体在多达123万个基因组位置的基因型数据,旨在支持人口历史和自然选择研究。数据集经过重新处理以提高一致性,并定期更新以保持其科学价值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务