five

牙龈 RNA 高通量测序数据集

收藏
贵州省数据知识产权登记平台2026-06-30 更新2026-07-01 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=3318&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
数据清洗:用FastQC/fastp去除低质量读段(Q30<80%)、接头污染及rRNA序列;剔除比对率<70%或管家基因表达异常的低质量样本;过滤未注释基因及在<3个样本中表达的基因,批量去除临床关键信息缺失记录。 标准化与注释:原始Reads Count统一比对至GRCh38/hg38参考基因组,基因ID映射至HGNC/Ensembl标准注释,表达量换算为TPM/FPKM并做log2归一化,用ComBat/Harmony校正批次效应;临床分组(健康/牙龈炎/牙周炎)按受控词表编码。 数据集构建:将样本临床特征表与基因表达矩阵按匿名化样本ID关联,整理为结构化表达谱宽表(CSV/TSV格式),对患者身份信息做不可逆去标识化处理形成最终数据集
提供机构:
陈彬
创建时间:
2026-06-12
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集为牙龈RNA高通量测序数据,经标准化处理(比对至GRCh38/hg38参考基因组,表达量换算为TPM/FPKM并做log2归一化,使用ComBat/Harmony校正批次效应),构建为结构化表达谱。数据规模100条,覆盖牙周炎、牙龈炎等口腔疾病的发病机制研究、分子诊断标志物筛选及靶向药物研发等场景。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务