树鼩组织特异性转录组数据集

Name: 树鼩组织特异性转录组数据集
Creator: 中国科学院昆明动物研究所
Published: 2025-12-12 14:52:26
License: 暂无描述

国家非人灵长类实验动物资源库2025-12-12 更新2026-02-07 收录

下载链接：

https://nhp.kiz.ac.cn/93/db

下载链接

链接失效反馈

官方服务：

资源简介：

树鼩（Tupaia belangeri chinensis）现归类于攀缘目（Scandentia），广泛分布于南亚、东南亚及中国西南地区。作为与灵长类动物系统发育关系最近的非灵长类物种之一，树鼩因其在神经系统、代谢调控及免疫反应等方面与人类的高度相似性，近年来在人类疾病建模与治疗反应研究中受到越来越多的关注。在肝炎病毒感染、近视形成、社会压力与抑郁模型等多个生物医学领域，树鼩已被证明是一种可替代啮齿类与灵长类的理想实验动物模型。随着高通量测序技术的不断发展，本研究在前期全基因组测序与注释的基础上，进一步整合了二代测序与三代长读长测序（PacBio）数据，显著提升了基因组组装的连续性与结构准确性。同时，通过对重要组织（如脑、肝、肾、脾、肺等）进行高深度RNA测序与长读长转录组分析，系统获取并构建了多组织转录组数据集，揭示了树鼩在不同组织中的基因表达谱与调控特征。通过对这些数据的深入解析，研究团队进一步鉴定了关键蛋白编码基因，尤其是与神经功能、免疫调控、代谢通路及病毒感染反应相关的核心基因，为树鼩在疾病模型构建及功能基因研究中的应用提供了重要基础。数据质量：实验用成年中华树鼩由中国科学院昆明动物研究所实验动物中心饲育。动物经戊巴比妥钠麻醉后，采用磷酸盐缓冲盐水（PBS）进行心脏灌注。从四只动物体内采集多种组织（脂肪、大脑、皮质、心脏、海马、肠、肾、肝、肺、肌肉、卵巢、脾和睾丸）置于液氮中快速冷冻。RNA 提取、文库构建和测序由安诺优达基因科技（中国）完成。所有动物实验均经中国科学院昆明动物研究所动物伦理委员会批准。数据来源：RNA-seq步骤如下：每个样本取约 1 μg 总 RNA，使用 NEBNext® Ultra™ RNA Library Prep Kit for Illumina® 构建 500–1 000 bp 的 RNA-seq 文库。每个文库的质量通过 Agilent Bioanalyzer 2100 系统检测。文库在 Illumina NovaSeq 平台上进行测序，生成 150 bp 的双端读段。数据处理遵循与公开 RNA-seq 数据相同的 QC 流程。 SMRT 测序步骤如下：每个样本的总 RNA 使用 NEBNext® Ultra™ RNA Library Prep Kit for Illumina®分离，并按照制造商的说明书进行处理。通过 1% 琼脂糖凝胶监测 RNA 的降解和污染情况，RNA 纯度使用 NanoPhotometer® 分光光度计检测。RNA 完整性使用 Qubit® RNA Assay Kit 结合 Qubit® 2.0 荧光计和 RNA Nano 6000 Assay Kit 结合 Bioanalyzer 2100 系统进行评估。来自两只树鼩各组织的等量 RNA 被混合为一个混合 RNA 样品，用于 ISO-seq。按照 PacBio描述的 Isoform Sequencing (ISO-seq™) 协议，使用 Clontech SMARTer PCR cDNA 合成试剂盒和 BluePippin™ 尺寸选择系统分别制备了两个 ISO-seq 文库（<4 kb 和 >4 kb）。随后在 Pacific Bioscience Sequel 系统上，使用两个 SMRT cells 进行了 SMRT 测序。数据生产方式：为了确保树鼩基因组注释的稳健性和完整性，从基因表达综合数据库（GEO）、日本 DNA 数据库（DDBJ）以及中国国家生物信息中心（BIGD）获取了所有公开可用的树鼩 RNA-seq 数据集。这些转录组测序数据集最初来源于对正常和病理状态下的组织或细胞的测序，涵盖了广泛的生物学与病理学条件。我们对 RNA-seq 数据进行了如下质量控制（QC）策略，并剔除了不符合要求的数据。原始测序读段通过 Trimmomatic (v0.38) (Bolger et al., 2014) 去除接头和低质量序列，参数设置为“LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36”。在过滤后，使用 FastQC评估清洁读段的质量。通过 QC 的数据（Q30>20）被使用 STAR (v2.6.0c)比对到染色体水平的树鼩基因组（KIZ version 2: TS_2.0）。未通过 QC 的数据（即基因组比对率低于 75%）被舍弃。我们基于公开数据集和本研究新生成的数据的 RNA-seq 读段，使用 StringTie在参考基因组指导下组装 RNA 转录本。随后，利用 StringTie merge将组装的 RNA-seq 转录本模型与 SMRT 转录本模型合并，生成涵盖所有转录组数据集的统一转录本模型。为保证转录本的可靠性，在 RNA-seq 和 SMRT 转录本合并过程中，我们仅保留了高可信度表达的转录本（至少一个样本中 FPKM>0.5）。随后，使用 Gffcompare将组装的转录本模型与参考基因组 TS_2.0 的转录本模型进行比对。与参考模型不匹配的转录本被视为新鉴定的转录本。时间范围：2022年4月

提供机构：

中国科学院昆明动物研究所

创建时间：

2025-12-12