five

Habermans Cancer Survival Dataset

收藏
github2019-02-10 更新2024-05-31 收录
下载链接:
https://github.com/shiva-46/Survival-Haberman-Dataset-Analysis-EDA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的乳腺癌手术患者生存研究案例。数据集属性包括患者手术时的年龄、手术年份、检测到的阳性腋窝淋巴结数量以及生存状态。

This dataset comprises survival study cases of breast cancer surgery patients conducted at the University of Chicago Billings Hospital from 1958 to 1970. The dataset attributes include the patient's age at the time of surgery, the year of surgery, the number of detected positive axillary lymph nodes, and survival status.
创建时间:
2019-01-27
原始信息汇总

Habermans Cancer Survival Dataset 概述

数据集来源

数据集描述

  • 该数据集记录了1958年至1970年间,在芝加哥大学比林斯医院接受乳腺癌手术患者的生存情况。

属性信息

  1. 年龄:患者手术时的年龄(数值型)
  2. 手术年份:患者的手术年份(年份 - 1900,数值型)
  3. 阳性腋窝淋巴结数量:检测到的阳性腋窝淋巴结数量(数值型)
  4. 生存状态:患者的生存状态(类别型)
    • 1: 患者存活超过5年
    • 2: 患者在5年内去世
搜集汇总
数据集介绍
main_image_url
构建方式
Habermans Cancer Survival Dataset的构建汇集了1958至1970年间,在芝加哥大学Billings医院接受乳腺癌手术的病患案例。该数据集的构建基于四个关键属性:患者的年龄、手术年份、检测到的阳性腋下淋巴结数目以及患者五年内的生存状态,旨在通过这些变量预测患者术后五年的生存概率。
特点
该数据集的特点在于其专注于乳腺癌手术患者的长期生存率预测,包含的数据维度虽不繁多,但极具针对性。其数据质量较高,源于权威医疗机构,确保了研究的准确性和可靠性。此外,数据集的二元生存状态分类使得其在机器学习领域的生存分析应用中具有重要价值。
使用方法
使用该数据集时,研究者首先需了解各属性的具体含义,如年龄、手术年份等数值型特征,以及生存状态这一分类特征。数据集可直接用于构建预测模型,如逻辑回归、决策树等,以评估患者术后五年生存的概率。此外,数据集的探索性数据分析有助于揭示数据内在的分布规律和潜在的相关性,为后续建模提供指导。
背景与挑战
背景概述
Habermans Cancer Survival Dataset 乃是一项关于乳腺癌手术患者生存状况的研究数据集,创建于二十世纪中叶。该数据集源自1958年至1970年间,美国芝加哥大学Billings医院的一项临床研究。主要研究人员通过对患者年龄、手术年份及检测出的阳性腋下淋巴结数量等信息的详尽记录,旨在探究这些因素与患者五年生存率之间的关联。此数据集为乳腺癌预后研究提供了宝贵的实证资料,对医学研究领域尤其是癌症生存分析具有深远的影响。
当前挑战
数据集在构建和应用过程中面临的挑战主要包括:如何准确预测乳腺癌患者的长期生存概率,以及如何处理和分析数据集中的缺失值或异常值。此外,数据集在属性信息解释上的不充分,例如对于手术年份的处理仅为年份数字减去1900,增加了数据理解和分析难度。在模型构建时,如何有效利用有限的数据维度,以及如何克服数据集规模较小导致的模型泛化能力不足,亦是研究人员需深入探讨的问题。
常用场景
经典使用场景
在医学研究领域,Habermans Cancer Survival Dataset被广泛用于探索乳腺癌手术患者的生存率预测。该数据集通过患者的年龄、手术年份以及检测到的阳性腋下淋巴结数量等特征,旨在预测患者是否能够生存超过5年。经典的场景是将该数据集作为机器学习模型的训练集,以发展出准确的生存率预测模型。
衍生相关工作
Habermans Cancer Survival Dataset衍生了众多相关工作,包括但不限于改进预测算法、提出新的特征组合、以及结合其他医疗数据源进行多模态分析等。这些工作进一步扩展了该数据集的应用范围,推动了乳腺癌研究领域的发展。
数据集最近研究
最新研究方向
在乳腺癌生存率预测领域,Habermans Cancer Survival Dataset作为一类经典数据集,其研究价值在于探索患者术后五年生存率与年龄、手术年份及腋下阳性淋巴结个数之间的关系。近期研究集中于深度学习模型的构建与优化,旨在提升预测精确性,助力于临床决策支持系统的发展。此数据集关联的热点事件包括个体化医疗方案的制定,以及基于大数据的疾病趋势分析,对公共卫生政策制定及医疗资源分配具有深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作