five

Haberman-Dataset

收藏
github2020-01-24 更新2024-05-31 收录
下载链接:
https://github.com/amith996/Exploratory-Analysis-of-Haberman-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的乳腺癌手术患者生存情况的研究案例。数据集包含306个实例,4个属性(包括类别属性),属性信息包括患者手术时的年龄、手术年份、检测到的阳性腋窝淋巴结数量以及生存状态。

This dataset comprises research cases on the survival status of breast cancer surgery patients at the University of Chicago Billings Hospital from 1958 to 1970. The dataset includes 306 instances and 4 attributes (including the class attribute). The attribute information encompasses the patient's age at the time of surgery, the year of surgery, the number of positive axillary lymph nodes detected, and the survival status.
创建时间:
2020-01-24
原始信息汇总

数据集概述

数据集名称

Exploratory-Analysis-of-Haberman-Dataset

数据集描述

该数据集包含1958年至1970年间在芝加哥大学比林斯医院进行的一项研究中的病例,涉及接受乳腺癌手术患者的生存情况。

数据集大小

  • 实例数量:306
  • 属性数量:4

属性信息

  1. 患者手术时的年龄(数值型)
  2. 患者手术年份(年份 - 1900,数值型)
  3. 检测到的阳性腋窝淋巴结数量(数值型)
  4. 生存状态(类别属性):
    • 1 = 患者存活5年或更长时间
    • 2 = 患者在5年内死亡

缺失值情况

  • 无缺失属性值
搜集汇总
数据集介绍
main_image_url
构建方式
Haberman-Dataset 数据集的构建基于一项针对乳腺癌手术患者生存状况的研究,该研究于1958年至1970年间在芝加哥大学Billings医院进行。数据集涵盖了研究中的全部病例,包含患者手术时的年龄、手术年份、检测到的阳性腋下淋巴结数量以及患者的生存状态,共计306个实例,每个实例由4个属性构成,其中包含一个类别属性。
特点
该数据集的特点在于其简洁性与完整性,无缺失值,使得数据在预处理上更为高效。数据集的属性涵盖了个体的基本医疗信息,且生存状态作为类别属性,为研究乳腺癌患者的术后生存情况提供了直观的判断标准。此外,数据集规模适中,便于在小范围内开展详细的数据探索与分析。
使用方法
使用Haberman-Dataset数据集时,研究者首先需要理解各属性的医疗含义,以便准确解读数据。数据集可以直接加载至数据分析工具中进行探索性分析,或用于建立分类模型以预测患者的生存状态。用户需注意的是,数据集的年代背景可能对当前医疗实践产生一定影响,因此在应用模型时应考虑时代差异带来的变量意义变化。
背景与挑战
背景概述
Haberman-Dataset是一项始于1958年,延续至1970年的医学研究数据集,源自于芝加哥大学Billings医院对乳癌手术患者生存状况的长期跟踪。该数据集由306个病例构成,主要研究人员不详,但该数据集的构建为医学研究尤其是癌症生存分析领域提供了珍贵的原始数据资源,对后续相关研究产生了深远影响。
当前挑战
数据集构建过程中所面临的挑战主要包括:如何准确记录并分类患者的生存状况,以及如何处理与患者手术相关的多维度信息。在研究领域内,该数据集所解决的挑战是如何利用有限的属性(如患者年龄、手术年份、淋巴结阳性数量)来预测患者的术后生存概率,这对于提高乳癌治疗效果和患者生存率具有极为重要的现实意义。
常用场景
经典使用场景
在医学研究领域,尤其是肿瘤生存分析中,Haberman-Dataset被广泛作为经典的数据集使用。该数据集记录了患者在接受乳腺癌手术后的生存情况,研究人员通常利用它来训练和测试各种预测模型,以期对患者的生存状况进行准确预测。
实际应用
在实际应用中,Haberman-Dataset的运用不仅限于学术研究,它还被应用于临床决策支持系统中,帮助医生根据患者的具体特征进行风险分层,制定更为个性化的治疗方案。
衍生相关工作
基于Haberman-Dataset的研究衍生出了众多相关工作,包括改进的生存分析算法、新型数据挖掘技术在医疗数据分析中的应用,以及结合多源数据对患者预后进行综合评估的方法论研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作