five

Lung Cancer 用于肺癌风险预测

收藏
Data Castle2022-11-03 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=2409
下载链接
链接失效反馈
官方服务:
资源简介:
#### 背景描述 这些合成患者数据集是为肺癌风险预测的机器学习(ML)研究和学习卫生系统的模拟研究而创建的。 由于Synthea患者与真实患者非常相似,因此Synthea患者数据可以用于开发和测试ML算法和管道,以及培训研究人员。与真实的患者数据不同,这些Synthea数据集可以在任何地方与合作者共享,而无需担心隐私问题。 #### 数据说明 1. 在子文件夹“uncoverted”中:Synthea患者生成器生成了5个30K患者群体。我们选取了大约1100名肺癌患者和3000名对照组患者(没有肺癌),他们的电子健康记录(EHR)被处理成数据表文件,使用XGBoost等常用算法为机器学习做好准备。 2. 根目录:将5个30K患者数据集按顺序组合,形成5个不同大小的数据集,从30K到150K患者。新的数据集被重新采样,以保留所有肺癌患者和3倍左右的对照组患者。ml准备好的表文件还将连续数值转换为类别值。 #### 数据来源 https://www.nature.com/articles/s41598-022-23011-4 #### 问题描述 预测
提供机构:
keys
二维码
社区交流群
二维码
科研交流群
商业服务