five

HIV-ONT-Datasets

收藏
github2020-04-06 更新2024-05-31 收录
下载链接:
https://github.com/GenerGener/HIV-ONT-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
用于本地病毒RNA测序和组装的实践数据集。这些数据提供了一个模型(真实情况),用于直接病毒单体型分析,至少相隔6 kb的单核苷酸变异。

A practical dataset for local viral RNA sequencing and assembly. These data provide a model (ground truth) for direct viral haplotype analysis, featuring single nucleotide variants spaced at least 6 kb apart.
创建时间:
2020-04-06
原始信息汇总

数据集概述

数据集名称

HIV-ONT-Datasets

数据集描述

该数据集用于原生病毒RNA测序和组装的实践。数据提供了至少6 kb间隔的SNVs直接病毒单体型化的模型(地面实况)。

背景

数据来源于Tg26 HIV小鼠,该小鼠的gagpol-删除HIV人工整合到小鼠生殖系中。最近的一项未发表的PCR-free gDNA测序运行支持了15个HIV拷贝跨多个插入位点。

方法

从一只Tg26雄性小鼠的骨髓中提取基因组DNA,特别注意保持较长的gDNA。使用Longrange PCR创建约6 kb的扩增子。DNA在一台MinION上进行测序,使用SQK-LSK109按照制造商的协议进行。

结果

在预期的HIV转染部分中发现了49个单核苷酸变体,这些变体由深度短读测序支持。其中有3个是相邻的(因此是链接的),因此在单个鼠标中总共有46个变体跨15个HIV拷贝。

数据集来源

  • Dickie P; Felser J; Eckhaus M; Bryant J; Silver J; Marinos N; Notkins AL. 1991. HIV-associated nephropathy in transgenic mice expressing HIV-1 genes. Virology 185(1):109-19PubMed: 1926769MGI: J:90297.
  • Gener, Alejandro R. 2019. “Full-Coverage Sequencing of HIV-1 Provirus from a Reference Plasmid.” BioRxiv, January, 611848. https://doi.org/10.1101/611848.
  • Gener, Alejandro R, and Jason T Kimata. 2019. “Full-Coverage Native RNA Sequencing of HIV-1 Viruses.” BioRxiv, January, 845610. https://doi.org/10.1101/845610.

资金支持

本工作部分由贝勒医学院的机构支持资助;私人资金来自佛罗里达州杰克逊维尔的东海岸石油公司,以及ARG自己的私人资金,包括学生基因组学(手稿准备中)。ARG还连续多年获得了杰克逊维尔PFLAG奖学金。

搜集汇总
数据集介绍
main_image_url
构建方式
HIV-ONT-Datasets数据集的构建方法是通过对Tg26 HIV小鼠的骨髓提取 genomic DNA,进而执行长距离PCR以产生约6 kb的扩增片段。随后,使用Oxford Nanopore Technologies的MinION设备进行DNA测序,并通过MinKNOW软件进行实时碱基调用。在Galaxy平台上进行读段过滤与映射,最终使用IGV软件进行可视化分析,以构建起一套适用于原病毒RNA测序和组装的实践数据集。
特点
该数据集的特点在于提供了至少相隔6 kb的SNVs的直接病毒单倍型分类模型,即地面真实值,这对于分析HIV-1病毒的变异性具有重要价值。数据集中包含了49个单核苷酸变异,跨越了预期的转基因片段的HIV部分,并通过深度的短读段测序得到支持。此外,数据集利用了ONT DNA误差轮廓与原病毒RNA轮廓的相似性,以及随着新型碱基调用模型的发展,其准确性的提高。
使用方法
使用该数据集时,研究者可以参照README文件中提供的详细信息,对数据集中的读段进行过滤和映射,进而利用IGV软件进行可视化分析。用户应当注意,所有分析均基于'base 1'进行,且本页面未存储任何人类患者数据。此外,数据集的来源和引用文献也提供了丰富的背景信息,有助于研究者在具体应用时对数据集有更深入的理解。
背景与挑战
背景概述
HIV-ONT-Datasets是一个针对原生病毒RNA测序和组装的实践数据集。该数据集由Alejandro Gener创建,并提供了一个模型(基准真实值),用于直接病毒单倍型定相,特别是至少相隔6 kb的SNVs。此数据集的发布旨在服务于2020年4月5日至11日举办的COVID-19 Biohackathon。HIV-ONT-Datasets基于Tg26 HIV小鼠模型,该模型通过人工方式将删除了gagpol的HIV整合入小鼠生殖系中。该数据集的创建旨在克服短读取测序的局限性,并通过使用Oxford Nanopore Technologies的MinION设备进行长读取测序,为研究HIV复制和变体提供了一种新的视角。
当前挑战
该数据集在构建过程中面临的主要挑战包括:1) 长片段DNA的提取和扩增,这需要特殊的实验技术以保持DNA的完整性;2) 高精度长读取测序数据的获取与处理,这对数据分析提出了更高的要求;3) 短读取测序无法解决的远距离变体的定相问题,需要借助长读取技术进行解决。此外,数据集在解决HIV病毒复制和变异分析领域问题的同时,还需面对如何准确映射和解析长读取序列的挑战,这对于现有的生物信息学工具和方法来说是一个考验。
常用场景
经典使用场景
HIV-ONT-Datasets作为一类专注于HIV病毒原病毒RNA测序与组装的实践数据集,其经典使用场景在于为科研工作者提供了一种直接进行病毒单倍型定型的模型,尤其是在至少相隔6 kb的SNVs上。该数据集支持长片段读取,弥补了传统短读取测序在病毒变体相位分析上的不足,使得科研人员能够在更长的距离上对HIV变体进行精确的相位分析。
解决学术问题
该数据集解决了传统短读取测序在相隔较远病毒拷贝间变体相位分析上的难题,通过长片段读取技术,科研工作者能够识别并解析HIV病毒在宿主基因组中不同插入位点的遗传多样性。这对于深入了解HIV病毒的复制机制、病毒变异以及与宿主相互作用的机制具有重要的学术价值。
衍生相关工作
基于HIV-ONT-Datasets,已经衍生出一系列相关研究工作,如对HIV-1原病毒的完整测序分析,以及HIV病毒RNA的直接测序研究等。这些研究进一步揭示了HIV病毒的生物学特性,推动了相关治疗策略和药物设计的进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作