five

Data from: Long-range PCR allows sequencing of mitochondrial genomes from environmental DNA|环境DNA数据集|基因组测序数据集

收藏
DataONE2017-07-18 更新2024-06-26 收录
环境DNA
基因组测序
下载链接:
https://search.dataone.org/view/null
下载链接
链接失效反馈
资源简介:
As environmental DNA (eDNA) from macro-organisms is often assumed to be highly degraded, current eDNA assays target small DNA fragments to estimate species richness by metabarcoding. A limitation of this approach is the inherent lack of unique species-specific single-nucleotide polymorphisms available for unequivocal species identification. We designed a novel primer pair capable of amplifying whole mitochondrial genomes and evaluated it in silico for a wide range of ray-finned fishes (Class: Actinopterygii). We tested the primer pair using long-range PCR and Illumina sequencing in vitro on a mock community of fish species assembled from pooling genomic DNA extracted from tissues. In situ we utilized long-range PCR and Illumina sequencing to generate fragments between 16 and 17 kb from eDNA extracted from filtered water samples. Water samples were sourced from a mesocosm experiment and from a natural stream. We validated our method in silico for 61 orders of Actinopterygii; we successfully sequenced mitogenomes in vitro from all six species in our mock community. In situ we recovered mitogenomes for all species present in our mesocosms. We additionally recovered mitogenomes from 10 of 12 species caught at the time of water sampling and two species previously only detected from eDNA metabarcoding of short DNA fragments from a natural stream. Successful amplification of large fragments (>16 kb) from eDNA demonstrates that not all eDNA is highly degraded. Sequencing whole mitogenomes from filtered water samples will alleviate many problems associated with identification of species from short-fragment PCR amplicon-based methods.
创建时间:
2017-07-18
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

DrugBank, TWOSIDES

DrugBank和TWOSIDES是用于药物-药物相互作用(DDI)预测的两个广泛使用的公共数据集。DrugBank包含86种药物间的药理相互作用,而TWOSIDES记录了药物间的副作用,保留了209种相互作用类型。这些数据集通过提取药物指纹和使用生物医学网络作为辅助信息,用于训练和评估DDI预测模型。数据集的应用领域主要集中在药理学和医疗保健中,旨在通过预测药物间的潜在相互作用来提高患者安全和治疗效果。

arXiv 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

ANC

美国国家语料库(American National Corpus,简称ANC)是一个大规模的电子美国英语语料库,包含多种类型文本及口语数据转录,旨在全面反映美国英语的多样性。其开放部分OANC约有1500万字,涵盖多种文体,且进行了自动标注。

anc.org 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录