five

Nymphaea minuta gemoic files

收藏
Figshare2026-02-11 更新2026-04-28 收录
下载链接:
https://figshare.com/articles/dataset/Nymphaea_minuta_gemoic_files/31293586
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集提供了完整的端粒到端粒(T2T)级别的幼虫基因组组装,并附有全面的结构和重复元素注释。该基因组资源包含以下四个核心文件:final_new_N_minuta_T2T.fasta:FASTA格式的主要基因组组装。该文件包含完整且连续的染色体序列(如Chr3),代表高质量的T2T级Nymphaea minuta基因组组装。Nminuta.rename.gff3:一个标准的GFF3文件,详细介绍结构基因注释。它包含精确的基因组坐标和基因特征(基因、mRNA、外显子、CDS)的层级模型,这些模型由GeneMark.hmm3和AUGUSTUS等工具预测。每个特征都被赋予一个唯一标识符(例如,Nmin_1G000001)。N_minuta_T2T.fasta.out.gff:一个由RepeatMasker生成的GFF3文件,用于注释基因组中的重复元素。它识别并分类转座元件及其他重复序列(标记为dispersed_repeat),提供其基因组位置和特定家族(例如TE_00000803_LTR)的信息。N_minuta_T2T.fasta.tbl:RepeatMasker分析的统计摘要报告。该报告对重复元素进行了定量概述,显示约38.20%的~382.62 Mb基因组由散布重复序列组成,其中LTR逆转录元件(尤其是Ty1/Copia,占10.08%)最为丰富。方法摘要:基因组组装至端粒到端粒级别。基因注释使用多种从始预测程序(GeneMark.hmm3、AUGUSTUS)组合完成。重复元素通过RepeatMasker(v4.1.5)在敏感模式下对自定义库(N_minuta_T2T.fasta.mod.EDTA.TElib.fa)进行识别和分类。潜在的重复利用:该数据集是比较基因组学、重复动力学进化研究以及微型若虫及相关水生植物分子研究的基础资源。
创建时间:
2026-02-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作