DNA Sequencing Costs
收藏github2022-09-14 更新2024-05-31 收录
下载链接:
https://github.com/datasets/genome-sequencing-costs
下载链接
链接失效反馈官方服务:
资源简介:
多年来,国家人类基因组研究所(NHGRI)一直跟踪由研究所资助的测序中心进行的DNA测序成本。这些信息作为评估DNA测序技术改进和确定NHGRI基因组测序计划(GSP)DNA测序能力的重要基准。这里,NHGRI提供了这些数据的分析,展示了近年来DNA测序技术和数据生产管道的显著改进。
Over the years, the National Human Genome Research Institute (NHGRI) has tracked the costs of DNA sequencing conducted by sequencing centers funded by the institute. This information serves as a critical benchmark for evaluating improvements in DNA sequencing technologies and determining the DNA sequencing capabilities of NHGRI’s Genome Sequencing Program (GSP). Here, NHGRI presents an analysis of these datasets, demonstrating the remarkable advancements in DNA sequencing technologies and data production pipelines in recent years.
创建时间:
2015-12-21
原始信息汇总
DNA Sequencing Costs 数据集概述
数据描述
描述
多年来,国家人类基因组研究所(NHGRI)一直跟踪由该研究所资助的测序中心进行的DNA测序成本。这些信息作为评估DNA测序技术改进和确定NHGRI基因组测序计划(GSP)测序能力的重要基准。NHGRI提供了这些数据的分析,展示了近年来DNA测序技术和数据生产流程的显著改进。
时间范围
2001-2015
进一步信息
有关成本分类、DNA测序技术、质量和基因组覆盖率的更多信息,请访问:http://www.genome.gov/sequencingcosts/
引用
- Wetterstrand KA. DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP) Available at: www.genome.gov/sequencingcosts. Accessed [21-12-2015].
来源
- 名称:国家人类基因组研究所
- 网址:http://www.genome.gov/pages/der/sequencing_costs_oct2015.xlsx
准备
要求
需要Python 2以及urllib和datautil模块来处理数据。
处理
运行以下脚本从当前目录下载和处理数据: bash make
资源
- 原始数据存储在目录
./archive/中。 - 处理后的数据存储在目录
./data中。
许可证
ODC-PDDL-1.0
本数据包在公共领域 dedication 和 license v1.0 下提供,完整文本可在以下网址找到:http://www.opendatacommons.org/licenses/pddl/1.0/
搜集汇总
数据集介绍

构建方式
DNA测序成本数据集由美国国家人类基因组研究所(NHGRI)构建,旨在追踪其资助的测序中心进行DNA测序的相关成本。该数据集涵盖了2001年至2023年的时间跨度,记录了DNA测序技术的成本变化,反映了技术进步对测序成本的影响。数据来源可靠,基于NHGRI的基因组测序计划(GSP),并通过其官方网站公开发布,确保了数据的透明性和可追溯性。
特点
该数据集的核心特点在于其时间跨度的广泛性,涵盖了DNA测序技术从早期到现代的演变过程。数据不仅包括测序成本的变化,还提供了对不同测序技术、质量标准和基因组覆盖率的详细分析。此外,数据集通过NHGRI的权威发布,确保了数据的科学性和可信度,为研究DNA测序技术的历史发展及其经济影响提供了重要参考。
使用方法
使用该数据集时,用户需具备Python 3环境,并安装`scripts/requirements.txt`中列出的依赖模块。通过运行`make`命令,用户可以自动下载并处理数据。原始数据存储在`./archive/`目录中,处理后的数据则位于`./data`目录。数据集以ODC-PDDL-1.0许可证发布,允许用户在公共领域自由使用和分发数据,适用于学术研究、技术评估及政策制定等多种场景。
背景与挑战
背景概述
DNA测序成本的追踪与分析在基因组学研究领域具有重要的参考价值。自2001年起,美国国家人类基因组研究所(NHGRI)便开始系统地记录其资助的测序中心所进行的DNA测序成本数据。这些数据不仅为评估DNA测序技术的进步提供了关键基准,还为NHGRI基因组测序计划(GSP)的测序能力提供了量化依据。近年来,随着测序技术的飞速发展,这些数据揭示了测序成本的大幅下降,推动了基因组学研究的广泛应用。该数据集的时间跨度从2001年至2023年,涵盖了测序技术从第一代到下一代的重要演变过程。
当前挑战
DNA测序成本数据集的研究面临多重挑战。首先,测序技术的快速迭代使得成本数据的标准化和跨时期比较变得复杂,不同技术平台和测序方法之间的成本差异需要精确校准。其次,数据采集过程中涉及的测序中心众多,数据质量和一致性难以完全统一,这对数据的可靠性和可比性提出了更高要求。此外,随着测序技术的普及,测序成本的计算方式也在不断演变,如何准确反映测序成本的真实变化成为一大难题。最后,数据集的构建需要整合多源异构数据,这对数据处理和分析的技术能力提出了严峻挑战。
常用场景
经典使用场景
DNA测序成本数据集广泛应用于基因组学研究领域,特别是在评估DNA测序技术的进步和成本效益分析中。研究人员通过该数据集能够追踪自2001年以来DNA测序成本的变化趋势,从而为基因组测序项目的预算规划和资源分配提供科学依据。该数据集还为生物信息学领域的算法优化和计算资源管理提供了重要的参考数据。
解决学术问题
该数据集解决了基因组学研究中关于测序技术成本效益评估的关键问题。通过长期追踪测序成本的变化,研究人员能够量化技术进步对测序成本的影响,进而为未来测序技术的研发方向提供数据支持。此外,该数据集还为基因组测序项目的经济可行性分析提供了重要依据,推动了基因组学研究的可持续发展。
衍生相关工作
基于DNA测序成本数据集,许多经典研究工作得以展开。例如,Mardis等人利用该数据集分析了测序技术的十年发展历程,揭示了技术进步对测序成本的影响。Metzker的研究则进一步探讨了下一代测序技术的经济性和应用前景。此外,Stein的研究提出了云计算在基因组信息学中的应用,为降低测序成本提供了新的解决方案。这些研究不仅推动了测序技术的发展,还为基因组学研究的广泛应用奠定了基础。
以上内容由遇见数据集搜集并总结生成



