口腔阻生疾病基因表达与分子标记基准数据集
收藏贵州省数据知识产权登记平台2026-06-30 更新2026-07-01 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=3319&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据清洗:剔除测序质量Q30<80%、比对率<70%或管家基因表达异常的低质量样本;删除基因ID无法匹配Ensembl/HGNC注释、表达量为空及关键临床信息(年龄、阻生类型、炎症程度)缺失的记录。
标准化与注释:基因表达原始Reads Count统一转换为TPM/FPKM并做log2变换消除批次效应;基因及分子标记统一映射至RefSeq hg38标准ID,阻生分型按Winter分类法、临床炎症分级按受控词表编码赋值。
数据集构建:将样本临床特征表与基因–分子标记表达矩阵按匿名化样本ID关联,整理为基准结构化表达谱与标记注释宽表(CSV/TSV格式),并对受试者身份信息进行不可逆去标识化处理。
提供机构:
陈彬
创建时间:
2026-06-12
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集为口腔阻生疾病研究提供标准化基准,包含经严格质量控制的基因表达谱与分子标记注释数据,数据规模100条,每周更新。数据源自测序样本,经过低质量样本剔除、基因ID统一映射、表达量标准化及临床信息编码等处理,最终生成结构化宽表。其应用覆盖发病机制研究、早期诊断标记筛选、靶向药物研发及手术辅助决策等场景。
以上内容由遇见数据集搜集并总结生成



