贵州少数民族人群常见慢性病风险评估模型
收藏贵州省数据知识产权登记平台2025-12-18 更新2025-12-19 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=1990&type=1
下载链接
链接失效反馈官方服务:
资源简介:
1、数据采集:
根据暴露因素与健康指标采集规则:采集贵州省侗、苗和布依族人群的人口学信息、生活方式(吸烟、饮酒、体力活动等)、特色饮食;在现场测量基本健康指标,并确保数据一致性与完整性。
2、模型构建:
数据预处理规则:对连续变量(如BMI、年龄等)进行标准化;对分类变量(如民族、吸烟状态等)编码;对缺失值进行插补。
构建机器学习模型,进行贵州省常见慢性病(包括高血压、糖尿病、血脂异常、肥胖、脂肪肝、高尿酸血症、代谢综合征、骨量异常、慢性肾病、肾结石、胆结石等)风险评估,包括:采用随机森林捕捉非线性关系与特征重要性排序;梯度提升树实现高精度预测;支持向量机和多层感知机适应小样本但高维特征场景和复杂交互。
模型的输入特征涵盖行为、人口学及生化指标特征,目标结局为高血压、糖尿病、血脂异常等二分类结局。
进一步进行模型验证、性能评估、择优和集成。
3、应用:根据模型输出的预测概率划分疾病风险等级,针对贵州省苗、侗、布依族人群分别设定风险阈值和干预优先级。
提供机构:
贵州医科大学
创建时间:
2025-12-17
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是贵州医科大学申请的一个风险评估模型,专门针对贵州省的苗、侗、布依族人群,旨在通过机器学习方法预测多种常见慢性病(如高血压、糖尿病、血脂异常等)的风险。它基于多维度数据(包括人口学特征、生活方式、生化指标等)构建,并采用随机森林、梯度提升树等算法进行精准风险分层,以支持民族地区的慢性病预防工作。数据规模为10.3MB,包含15个结构化字段,如性别、年龄、民族和健康指标,用于模型训练和验证。
以上内容由遇见数据集搜集并总结生成



