five

宫颈癌风险因素数据

收藏
浙江省数据知识产权登记平台2025-07-23 更新2025-07-24 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/153266
下载链接
链接失效反馈
官方服务:
资源简介:
本项目衍生的算法模型及其所登记的数据,适用于18岁及以上女性的宫颈癌筛查辅助判断场景,广泛应用于基层医院、妇幼保健院及公共卫生筛查平台,用于实现高风险个体的智能识别与分层管理。数据需来源于常规妇科检查(如TCT、HPV)及相关问诊信息,确保模型输入的准确性和完整性。模型可辅助医生进行初筛预警、检查建议及随访安排,有效缓解筛查资源压力、提升早诊效率。该成果不适用于孕妇、免疫异常群体及缺乏基础筛查结果的个体。一、数据采集 数据主要通过授权采集的临床获得(主要是问诊、液基细胞检测、病毒检测等环节),涵盖了受检者的基本人口学信息(如年龄、性行为史、怀孕史等)、生活方式(如吸烟、避孕方式等)、既往病史(包括性传播疾病、HPV感染、宫颈病变等)、多项医学检查结果(如Hinselmann、Schiller、细胞学检查和活检结果)以及企业分析过程数据。 二、数据处理 首先对原始数据进行缺失值处理,将“?”等缺省标记转换为null,并使用变量中位数进行填补。随后,采用标准化处理将所有连续变量映射为零均值单位方差形式:Xscaled=X−μσX_{\text{scaled}} = \frac{X - \mu}{\sigma}Xscaled​=σX−μ​,以确保模型训练稳定性。模型构建方面,采用Keras构建多层感知机(MLP)网络,包含两层隐藏层(64和32个神经元),激活函数为ReLU,设置Dropout层(0.3和0.2)防止过拟合,输出层使用Sigmoid函数预测概率。训练中以二元交叉熵作为损失函数:L=−1N∑[ylog⁡(y^)+(1−y)log⁡(1−y^)]\mathcal{L} = -\frac{1}{N} \sum [y \log(\hat{y}) + (1 - y) \log(1 - \hat{y})]L=−N1​∑[ylog(y^​)+(1−y)log(1−y^​)],优化器为Adam,并应用EarlyStopping策略自动终止过拟合的训练过程。在模型输出基础上,构建多层次风险解释变量,包括原始预测概率(Risk_Score)、二分类标签(Risk_Label)、三档风险等级(Risk_Level)、logit线性分值(Risk_Score_Logit)和等级评分(Risk_Grade),以增强模型的可解释性和临床应用价值。
提供机构:
阿卡姆依(杭州)科技有限公司
创建时间:
2025-04-29
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作