five

Habermans Survival Data

收藏
github2020-03-08 更新2024-05-31 收录
下载链接:
https://github.com/ratnasankeerthanreddy/Exploratory-Data-Analysis-on-Haberman-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的一项研究中,接受乳腺癌手术患者的生存情况。数据集共有306个实例,包含4个属性,包括患者的年龄、手术年份、检测到的腋窝淋巴结数量以及生存状态。

This dataset comprises the survival outcomes of patients who underwent breast cancer surgery in a study conducted at Billings Hospital of the University of Chicago between 1958 and 1970. It contains a total of 306 instances with 4 attributes, including the patients' age, the year of surgery, the number of detected axillary lymph nodes, and the survival status.
创建时间:
2020-02-24
原始信息汇总

数据集概述

数据集名称

Habermans Survival Data

数据集来源

  • 捐赠者:Tjen-Sien Lim (limt@stat.wisc.edu)
  • 日期:1999年3月4日

数据集描述

该数据集记录了1958年至1970年间,在芝加哥大学比林斯医院接受乳腺癌手术患者的生存情况。

数据集规模

  • 实例数量:306
  • 属性数量:4(包括类别属性)

属性信息

  1. 患者手术时的年龄(数值型)
  2. 患者手术年份(年份 - 1900,数值型)
  3. 检测到的腋窝淋巴结阳性数量(数值型)
  4. 生存状态(类别属性)
    • 1:患者存活5年或更长时间
    • 2:患者在5年内死亡

缺失值情况

无缺失属性值

搜集汇总
数据集介绍
main_image_url
构建方式
Habermans Survival Data数据集的构建,源于1958至1970年间在芝加哥大学Billings医院进行的一项研究,该研究关注的是接受乳腺癌手术的患者生存情况。数据集共包含306个实例,每个实例涵盖4个属性,包括患者手术时的年龄、手术进行的年份、检测到的阳性腋下淋巴结数量以及患者的生存状态。
特点
该数据集的特点在于其包含了详尽的医疗信息,且所有数据均无缺失值。属性中既包括数值型的患者年龄和手术年份,也包括数值型的淋巴结数量,以及分类型的生存状态,使得数据集在构建生存分析模型时具有较高价值。
使用方法
使用Habermans Survival Data数据集,研究者可以导入数据集,对各个属性进行分析,进而构建统计模型以预测乳腺癌患者的生存概率。此外,数据集的历史使用记录表明,其适用于广义残差分析、逻辑回归模型评估以及逻辑回归树的构建等研究。
背景与挑战
背景概述
Habermans Survival Data数据集源于20世纪中叶的一项医学研究,该研究由芝加哥大学Billings医院在1958至1970年间开展,旨在探究接受乳腺癌手术的患者生存情况。此数据集由Tjen-Sien Lim于1999年捐赠,包含了306个病例的详细信息,是医学统计和生存分析领域的重要资源。数据集的核心研究问题关注于患者术后生存率的预测,对乳腺癌的预后评估和相关治疗策略的制定具有显著影响。
当前挑战
数据集构建过程中,研究人员面临了如何准确记录和分类患者生存状态的挑战,同时,数据集在属性选择和特征工程方面的处理也是一大挑战。在研究领域中,利用该数据集进行生存分析时,面临的挑战包括如何处理数据集中的连续变量、如何建模以准确预测生存状态,以及如何评估模型的有效性和泛化能力。
常用场景
经典使用场景
在医学统计学领域,Habermans Survival Data数据集被广泛用于生存分析的案例研究。该数据集记录了患者在接受乳腺癌手术后五年内的生存状况,是进行生存率预测、风险评估的经典场景。
衍生相关工作
基于此数据集,衍生出了一系列相关研究工作,如逻辑回归模型、图形模型评估、以及逻辑回归树等,为后续的统计模型研究提供了丰富的案例和理论基础。
数据集最近研究
最新研究方向
Habermans Survival Data数据集作为医学研究领域的重要资源,近年来其在统计模型构建与疾病生存预测方面的应用备受关注。该数据集被用于开发与验证各类预测模型,如逻辑回归树模型,旨在提高对乳腺癌患者术后生存率的预测准确性。当前,研究人员正致力于通过该数据集探索深度学习技术在生存分析中的应用,以期发现更为精确的生物标志物和治疗响应指标,为个性化医疗和精准治疗提供数据支撑。此类研究对于优化乳腺癌患者的治疗方案及改善生存质量具有深远的影响和意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作