树鼩参考基因组数据集
收藏国家非人灵长类实验动物资源库2025-12-12 更新2026-02-07 收录
下载链接:
https://nhp.kiz.ac.cn/94/db
下载链接
链接失效反馈官方服务:
资源简介:
本数据集基于高精度二代与三代(PacBio)的树鼩基因组测序数据进行重新组装与整合,显著提高了序列连续性与基因结构解析的准确性。除常规的基因与转录本注释外,还系统性地纳入了非编码元素的注释信息,特别是 环状 RNA(circRNA) 和 核线粒体 DNA 片段(NUMTs)。circRNA 作为一种具有组织特异性和进化保守性的非编码 RNA,在基因表达调控、疾病发生以及病毒感染反应中发挥重要作用;而 NUMTs 的识别与标注则有助于厘清核基因组与线粒体基因组之间的遗传关系,为进化分析与基因组结构研究提供可靠参考。这些新增的注释内容不仅拓展了树鼩基因组资源的深度与广度,还为研究者开展 非编码 RNA 功能解析、基因组结构变异研究、以及树鼩在疾病模型中的应用探索 提供了更为全面的数据支持。
数据质量:实验用成年中华树鼩由中国科学院昆明动物研究所实验动物中心饲育。所有动物实验均经中国科学院昆明动物研究所动物伦理委员会批准。动物经戊巴比妥钠麻醉后,采用磷酸盐缓冲盐水(PBS)进行心脏灌注,采集多组织进行提取,包括大脑、肌肉、肝脏、肠道、睾丸等。RNA 提取、文库构建和测序由安诺优达基因科技(中国)完成。
数据来源:RNA-seq步骤如下:每个样本取约 1 μg 总 RNA,使用 NEBNext® Ultra™ RNA Library Prep Kit for Illumina® 构建 500–1 000 bp 的 RNA-seq 文库。每个文库的质量通过 Agilent Bioanalyzer 2100 系统检测。文库在 Illumina NovaSeq 平台上进行测序,生成 150 bp 的双端读段。数据处理遵循与公开 RNA-seq 数据相同的 QC 流程。
SMRT 测序步骤如下:每个样本的总 RNA 使用 NEBNext® Ultra™ RNA Library Prep Kit for Illumina®分离,并按照制造商的说明书进行处理。通过 1% 琼脂糖凝胶监测 RNA 的降解和污染情况,RNA 纯度使用 NanoPhotometer® 分光光度计检测。RNA 完整性使用 Qubit® RNA Assay Kit 结合 Qubit® 2.0 荧光计和 RNA Nano 6000 Assay Kit 结合 Bioanalyzer 2100 系统进行评估。来自两只树鼩各组织的等量 RNA 被混合为一个混合 RNA 样品,用于 ISO-seq。按照 PacBio描述的 Isoform Sequencing (ISO-seq™) 协议,使用 Clontech SMARTer PCR cDNA 合成试剂盒和 BluePippin™ 尺寸选择系统分别制备了两个 ISO-seq 文库(<4 kb 和 >4 kb)。随后在 Pacific Bioscience Sequel 系统上,使用两个 SMRT cells 进行了 SMRT 测序。
数据生产方式:a.环状RNA注释
我们使用了来自四个树鼩肝脏的剔除核糖体的RNA测序文库来鉴定树鼩的circRNA。首先,我们使用STAR 软件将转录组数据与树鼩参考基因组(TS_3.0)进行比对,并获得了关于嵌合剪接位点的信息。然后,使用DCC软件根据嵌合剪接位点来识别circRNA。在数据库中,用户可根据circRNA注释来提取circRNA序列。
b.核基因组线粒体假基因(NUMTs)鉴定
首先,使用用Tantan软件对线粒体序列和树鼩参考基因组的重复性和低复杂性区域进行屏蔽。然后,我们使用LAST(https://github.com/michaeldubyu/LAST/)将树鼩线粒体基因组与染色体水平的基因组进行比对,参数为:" +1 for matches, −1 for mismatches, +7 for gap-open penalty, +1 for gap-extension penalty, 10−3 for E-value threshold"。为了获得无偏见的比对结果,无论选择何种切割点(圆形线粒体基因组被切割和线性化),我们在比对前在切割点连接两个线性线粒体基因组。
时间范围:2022年4月
提供机构:
中国科学院昆明动物研究所
创建时间:
2025-12-12



