five

树鼩自发疾病家系样本全基因组测序数据信息

收藏
国家非人灵长类实验动物资源库2025-12-12 更新2026-02-07 收录
下载链接:
https://nhp.kiz.ac.cn/96/db
下载链接
链接失效反馈
官方服务:
资源简介:
本研究针对树鼩自发疾病家系样本开展了全基因组测序分析,旨在揭示树鼩自发疾病(尤其是自发性白内障)的潜在遗传机制。通过高深度测序与系统性变异检测,共获得83个个体的全基因组数据,并鉴定出22,431,650个位点的基因组变异。其中包括14,730,085个单核苷酸多态性位点(SNPs)与7,701,565个小片段插入缺失(InDels),后者由3,514,133个插入和4,187,432个缺失构成。对所有变异进行功能影响预测后发现,具有高影响力(High effect)的突变(如移码突变、基因融合、提前终止密码子突变等)共有27,680个,占比0.112%;中等影响力(Moderate effect)的突变(如非同义突变、转录剪切位点变异等)共有119,726个,占比0.486%;低影响力(Low effect)变异共有268,850个,占比1.09%。 这些变异数据在高覆盖度、高准确性测序基础上生成,结合完善的树鼩参考基因组注释信息,为群体遗传学及疾病致因研究提供了坚实的数据支撑。在进一步分析中,我们聚焦于自发性白内障家系。通过检测32个患病家系个体及03家系患病个体共同的杂合缺失区间(Runs of Homozygosity,ROH),共发现430个共享ROH片段。其中231个ROH未出现在健康个体中,被视为潜在致病区域,总长度约4,552.7 kb,包含237个基因。经与白内障致病基因数据库(OMIM、IMPC、CAT-map)交叉比对,发现5个基因可能与白内障的发生密切相关,分布于染色体17和染色体9的4个ROH区间内。这些结果提示,患病个体特异的ROH中可能富集了致病突变,其累积可能导致树鼩自发性白内障的发生,为进一步功能验证提供了候选靶标。 数据质量:实验用成年中华树鼩由中国科学院昆明动物研究所实验动物中心饲养。所有动物实验均经中国科学院昆明动物研究所动物伦理委员会批准。研究共纳入83只树鼩个体样本,包括健康与自发疾病(主要为白内障)家系个体。测序数据由Illumina高通量平台生成,平均测序深度约30×,各样本Q30碱基比例均超过90%,确保测序结果的高准确性与可靠性。数据经严格质控与去噪处理:使用Trimmomatic 2去除接头污染、低质量reads及含N比例高的reads;保留的有效reads比例超过95%。比对使用BWA软件将reads精准映射至树鼩参考基因组,重复序列由Markduplicate标记并去除。 变异检测与过滤遵循GATK v4.1标准流程,采用参数 DP<8 || QD<5.0 || HRun>5 || SB>0.00 || QUAL<50 || FS>60.0 || MQ<40.0 || HaplotypeScore>13.0 对低质量变异进行剔除。变异功能注释采用SnpEff与ANNOVAR完成,确保各类突变影响评估的准确性与一致性。总体而言,数据完整性高、背景噪声低,能够可靠支撑群体变异统计与候选致病区域筛选。 数据来源:a.样本来源与测序 研究共纳入83只树鼩个体样本,包括健康与自发疾病(主要为白内障)家系个体。样本来源明确、表型记录完整。基因组DNA经质量评估合格后用于文库构建,采用Illumina平台进行双端测序(paired-end sequencing)。 b.参考基因组与比对 使用树鼩参考基因组作为比对模板。 c.变异检测与功能注释 使用GATK v4.1进行SNP和InDel检测,并通过GATK VariantFiltration模块进行硬过滤。随后利用SnpEff与ANNOVAR软件注释变异位点的功能影响等级(High、Moderate、Low)。 d.ROH分析与致病区域筛选 通过PLINK软件计算患病个体的ROH区间,并筛选在所有患病个体中共享、但不出现在健康个体中的ROH区域。进一步将这些区域中的基因与已知白内障致病基因数据库进行交叉比对,以筛选潜在致病候选基因。 数据生产方式:树鼩样本采自多个自然家系与实验室维持种群,覆盖自发疾病表型个体与对照健康个体。样本经形态及临床表现鉴定后,提取高纯度基因组DNA。DNA浓度与完整性经Qubit、Nanodrop及琼脂糖凝胶电泳检测确认。原始fastq文件经Trimmomatic 2过滤低质量reads与接头序列。过滤后数据经FastQC评估整体质量,确保无系统性偏差。使用BWA-MEM算法比对至参考基因组,比对率超过98%。SAMtools及Picard用于排序、去重复与索引。随后使用GATK HaplotypeCaller进行单样本变异检测,GenotypeGVCFs进行联合分型。利用GATK VariantFiltration进行硬过滤,去除低覆盖、低质量或可能误判的位点。随后使用ANNOVAR与SnpEff进行功能注释,评估突变的潜在生物学效应。ROH分析采用PLINK(--homozyg命令)计算个体连续纯合区间,筛选出患病个体间共有但健康个体中缺失的ROH区域。结合OMIM、IMPC、CAT-map等数据库进行候选基因交叉验证,确定潜在致病基因。 时间范围:2016年1月-2021年12月
提供机构:
中国科学院昆明动物研究所
创建时间:
2025-12-12
二维码
社区交流群
二维码
科研交流群
商业服务