five

Habermans Survival Data

收藏
github2020-03-02 更新2024-05-31 收录
下载链接:
https://github.com/seshuamrita/EDA-on-habermans-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的一项研究中,接受乳腺癌手术患者的生存情况。数据集共有306个案例,包含4个特征(包括类别),其中224个案例显示患者存活5年以上,81个案例显示患者在5年内去世。特征包括患者手术时的年龄、手术年份、阳性辅助淋巴结数量以及患者的生存状态。

This dataset encompasses the survival outcomes of patients who underwent breast cancer surgery at the University of Chicago Billings Hospital between 1958 and 1970. The dataset comprises 306 cases, featuring 4 attributes (including categories), with 224 cases indicating patient survival beyond 5 years and 81 cases indicating patient death within 5 years. The attributes include the patient's age at the time of surgery, the year of surgery, the number of positive auxiliary lymph nodes, and the patient's survival status.
创建时间:
2020-03-01
原始信息汇总

数据集概述

数据集名称

  • 名称:Habermans Survival Data

数据集描述

  • 描述:该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的一项研究中的病例,涉及接受乳腺癌手术患者的生存情况。

数据集统计

  • 数据点数量:306
  • 特征数量:4(包括类别)
  • 类别分布
    • 生存状态为1(存活5年以上):224点
    • 生存状态为2(5年内死亡):81点

特征说明

  • age:患者手术时的年龄
  • year:手术年份
  • nodes:阳性辅助淋巴结数量
  • Survival status:生存状态(类别属性)
    • 1:患者存活5年以上
    • 2:患者5年内死亡

数据集目标

  • 目标:基于患者的年龄、手术年份和淋巴结数量等独立变量,预测或分类患者在治疗后5年内是否存活。
搜集汇总
数据集介绍
main_image_url
构建方式
Habermans Survival Data数据集的构建基于一项在1958年至1970年间于芝加哥大学Billings医院开展的研究,该研究关注的是接受乳腺癌手术的患者生存情况。数据集由306个样本点构成,每个样本点包含4个特征,其中包含一个类别属性,即患者的生存状态。
特点
本数据集的特点在于其简洁而具代表性,涵盖了患者的年龄、手术年份、阳性辅助淋巴结数量以及生存状态。生存状态分为两类:类别1代表患者术后至少生存5年,类别2则表示患者在5年内去世。数据集中,生存状态为类别的样本点分别有224个和81个,展现了良好的数据分布。
使用方法
使用该数据集时,研究者可以基于患者的年龄、手术年份及淋巴结数量这三个独立变量,预测或分类患者在术后5年的生存情况。数据集可通过常规的数据处理和分析工具进行读取和操作,便于开展机器学习模型的训练与评估。
背景与挑战
背景概述
Habermans Survival Data数据集,源自1958年至1970年间在芝加哥大学Billings医院开展的一项研究,该研究旨在探讨接受乳腺癌手术的患者生存情况。数据集包含306个病例,涵盖患者的年龄、手术年份、阳性辅助淋巴结数量以及5年内的生存状态。该数据集为医学领域,尤其是乳腺癌预后研究提供了宝贵的实证基础,对相关领域的学术研究和临床决策支持具有深远影响。
当前挑战
数据集面临的挑战主要在于,首先,它解决的领域问题是预测患者在接受乳腺癌手术后5年内的生存概率,其挑战在于如何准确识别和利用影响生存状态的关键特征。其次,在构建过程中,数据集的规模相对较小,可能限制了模型预测的泛化能力。此外,数据集的特征包含时间变量,需考虑时间趋势对生存状态的影响,以及如何处理缺失或不完整的数据,这些都是数据分析和建模过程中必须克服的难题。
常用场景
经典使用场景
在医学研究领域,尤其是癌症生存率预测中,Habermans生存数据集被广泛作为经典案例。该数据集记录了患者在接受乳腺癌手术后的生存情况,其经典使用场景在于通过患者的年龄、手术年份以及阳性淋巴结数量等特征,预测患者五年生存率,进而辅助医疗决策和治疗方案的设计。
解决学术问题
该数据集解决了如何利用患者基本医疗信息预测生存概率的学术问题,对于理解乳腺癌患者的生存状况及其相关因素具有重要的研究意义。通过分析该数据集,研究者能够发现影响生存率的关键因素,为临床医学提供科学依据,推动医疗预测模型的构建与发展。
衍生相关工作
基于Habermans生存数据集的研究衍生出了众多相关经典工作,如开发更为精确的生存预测模型、探索新的特征组合对生存率的影响等。这些工作不仅推动了数据挖掘技术在医疗健康领域的应用,也为后续研究提供了丰富的理论资源和实践基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作