NGS datasets
收藏github2021-05-31 更新2024-05-31 收录
下载链接:
https://github.com/novogene-europe/ngs_demo_datasets
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含多种来自Novogene的测序数据集,任何对NGS感兴趣的研究人员、临床医生或合作者均可自由下载。我们欢迎任何建议或意见。
This repository encompasses a variety of sequencing datasets from Novogene, which are freely available for download by any researchers, clinicians, or collaborators interested in NGS (Next-Generation Sequencing). We welcome any suggestions or feedback.
创建时间:
2019-06-02
原始信息汇总
数据集概述
数据集来源
本数据集由Novogene提供,包含多种测序数据集,适用于对NGS技术感兴趣的研究人员、临床医生或合作者。
数据集内容
1. 人类基因组测序
- 样本: HG002(Ashkenazim son-father-mother trio成员之一,也称为NA24385)
- 测序类型:
- 全外显子测序
- 捕获试剂盒: Agilent SureSelect Human All Exon V6 Kit
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 18G
- 全基因组测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 20G
- 全外显子测序
2. 转录组测序
- 测序类型:
- mRNA测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 15G
- 全RNA测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 15G
- 单细胞RNA测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 7G
- mRNA测序
3. PacBio测序
- 测序类型:
- Isoform测序(Iso-Seq)
- 测序策略: PacBio Sequel
- 数据量: 4G
- PacBio基因组测序
- 测序策略: PacBio Sequel
- 数据量: 20G
- Isoform测序(Iso-Seq)
4. 10X Genomics
- 测序类型:
- 10X单细胞基因表达
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 27G
- 10X Linked-Reads基因组测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 100G
- 10X单细胞基因表达
5. 微生物基因组测序
- 测序类型:
- 16S扩增子测序
- 测序策略: Illumina NovaSeq, PE250
- 数据量: 30k tags
- 微生物重测序
- 测序策略: Illumina NovaSeq, PE150
- 数据量: 1.7G
- 16S扩增子测序
数据集使用
任何对NGS技术感兴趣的研究人员、临床医生或合作者均可自由下载使用本数据集。同时,欢迎提供任何建议或反馈。
搜集汇总
数据集介绍

构建方式
NGS数据集由Novogene公司构建,涵盖了多种测序技术,包括全基因组测序、全外显子测序、转录组测序、单细胞RNA测序以及PacBio测序等。数据来源多样,涵盖了人类、拟南芥、微生物等多种物种。测序策略主要基于Illumina NovaSeq和PacBio Sequel平台,确保了数据的高通量和高精度。每个数据集均提供了详细的测序信息,包括样本来源、测序策略、数据大小及MD5校验值,确保数据的完整性和可追溯性。
使用方法
研究人员可以通过GitHub页面或NCBI FTP站点下载所需的数据集。每个数据集均提供了详细的下载链接和MD5校验值,确保数据在传输过程中的完整性。下载后,用户可以使用标准的生物信息学工具进行数据分析,如比对、变异检测、基因表达分析等。对于转录组数据,用户可以利用ERCC spike-in对照进行表达量校正。数据集的使用无需特殊权限,研究人员、临床医生及合作者均可自由下载和使用,并欢迎提供反馈和建议。
背景与挑战
背景概述
NGS数据集由Novogene公司创建,旨在为研究人员、临床医生和合作者提供多种类型的测序数据,涵盖人类基因组测序、转录组测序、PacBio测序、10X Genomics以及微生物基因组测序等多个领域。该数据集的核心研究问题是通过高通量测序技术(NGS)生成高质量的基因组和转录组数据,以支持基因组学、转录组学和微生物组学的研究。Novogene作为全球领先的基因组服务提供商,拥有世界上最大的测序能力,其数据集在基因组学研究领域具有重要影响力,尤其是在基因组变异检测、基因表达分析和微生物多样性研究等方面。
当前挑战
NGS数据集在解决基因组学和转录组学领域的挑战时,面临多重技术难题。首先,数据生成过程中需要确保测序的准确性和覆盖度,尤其是在处理复杂基因组或低丰度转录本时,如何有效减少测序误差和偏差是一个关键问题。其次,数据量庞大,存储和处理这些数据对计算资源提出了极高的要求,尤其是在进行全基因组测序或单细胞RNA测序时,数据量可达数百GB甚至TB级别。此外,数据标准化和共享也是构建过程中的一大挑战,如何确保不同实验室生成的数据具有可比性,并能够被广泛使用,仍需进一步的技术和规范支持。
常用场景
经典使用场景
NGS数据集在基因组学和转录组学研究中扮演着至关重要的角色。该数据集包含了来自Novogene的多种测序数据,涵盖了人类基因组测序、转录组测序、PacBio测序以及10X Genomics等多个领域。研究人员可以利用这些数据进行基因组比对、变异检测、基因表达分析等经典应用,特别是在人类基因组测序中,HG002样本的数据被广泛用于与GIAB基准进行比较,验证测序技术的准确性和可靠性。
解决学术问题
NGS数据集为基因组学和转录组学研究提供了丰富的数据资源,解决了多个学术研究中的关键问题。例如,通过全基因组测序数据,研究人员能够深入分析基因组中的变异位点,揭示与疾病相关的遗传变异;转录组测序数据则帮助研究者探索基因表达调控机制,特别是在单细胞RNA测序中,能够揭示细胞间的异质性。此外,PacBio测序数据为长读长测序提供了支持,有助于解决基因组组装中的复杂区域问题。
实际应用
NGS数据集在实际应用中具有广泛的用途。在临床医学中,这些数据可以用于精准医疗,帮助医生根据患者的基因组信息制定个性化的治疗方案。在农业领域,转录组测序数据可以用于作物改良,通过分析基因表达模式,筛选出具有优良性状的品种。此外,微生物基因组测序数据在环境科学和工业微生物学中也有重要应用,例如通过16S测序分析微生物群落结构,或通过微生物重测序研究病原菌的进化与传播。
数据集最近研究
最新研究方向
近年来,NGS数据集在基因组学和转录组学领域的研究方向主要集中在高精度基因组测序、单细胞RNA测序以及微生物组测序等方面。随着Illumina NovaSeq和PacBio Sequel等新一代测序技术的广泛应用,研究者能够更深入地解析人类基因组中的复杂变异,尤其是在与GIAB(Genome in a Bottle)基准数据集的对比研究中,HG002样本的全基因组和外显子组测序数据为基因组变异检测提供了高置信度的参考。此外,单细胞RNA测序技术的进步使得研究者能够在单细胞水平上探索基因表达的异质性,特别是在癌症和发育生物学研究中展现了巨大的潜力。微生物组测序则推动了微生物群落结构和功能的研究,尤其是在16S rRNA测序和微生物重测序技术的支持下,研究者能够更精确地解析微生物与宿主之间的相互作用。这些前沿研究方向不仅推动了基础科学的进步,也为精准医学和个性化治疗提供了重要的数据支持。
以上内容由遇见数据集搜集并总结生成



