jarrydmartinx/support2
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jarrydmartinx/support2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: age
dtype: float64
- name: sex
dtype: string
- name: hospdead
dtype: int64
- name: slos
dtype: int64
- name: dzgroup
dtype: string
- name: dzclass
dtype: string
- name: num.co
dtype: int64
- name: edu
dtype: float64
- name: income
dtype: string
- name: scoma
dtype: float64
- name: charges
dtype: float64
- name: totcst
dtype: float64
- name: totmcst
dtype: float64
- name: avtisst
dtype: float64
- name: race
dtype: string
- name: sps
dtype: float64
- name: aps
dtype: float64
- name: surv2m
dtype: float64
- name: surv6m
dtype: float64
- name: hday
dtype: int64
- name: diabetes
dtype: int64
- name: dementia
dtype: int64
- name: ca
dtype: string
- name: prg2m
dtype: float64
- name: prg6m
dtype: float64
- name: dnr
dtype: string
- name: dnrday
dtype: float64
- name: meanbp
dtype: float64
- name: wblc
dtype: float64
- name: hrt
dtype: float64
- name: resp
dtype: float64
- name: temp
dtype: float64
- name: pafi
dtype: float64
- name: alb
dtype: float64
- name: bili
dtype: float64
- name: crea
dtype: float64
- name: sod
dtype: float64
- name: ph
dtype: float64
- name: glucose
dtype: float64
- name: bun
dtype: float64
- name: urine
dtype: float64
- name: adlp
dtype: float64
- name: adls
dtype: float64
- name: sfdm2
dtype: string
- name: adlsc
dtype: float64
- name: event_times
dtype: int64
- name: event_indicators
dtype: int64
splits:
- name: train
num_bytes: 3753153
num_examples: 9105
download_size: 827762
dataset_size: 3753153
---
# Dataset Card for "support2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:年龄(age),数据类型:float64
- 字段名:性别(sex),数据类型:string
- 字段名:住院期间死亡(hospdead),数据类型:int64
- 字段名:住院时长(slos),数据类型:int64
- 字段名:疾病组别(dzgroup),数据类型:string
- 字段名:疾病分类(dzclass),数据类型:string
- 字段名:合并症数量(num.co),数据类型:int64
- 字段名:受教育程度(edu),数据类型:float64
- 字段名:收入水平(income),数据类型:string
- 字段名:昏迷评分(scoma),数据类型:float64
- 字段名:住院费用(charges),数据类型:float64
- 字段名:总治疗费用(totcst),数据类型:float64
- 字段名:总医疗成本(totmcst),数据类型:float64
- 字段名:avtisst,数据类型:float64
- 字段名:种族(race),数据类型:string
- 字段名:sps,数据类型:float64
- 字段名:aps,数据类型:float64
- 字段名:2个月生存率(surv2m),数据类型:float64
- 字段名:6个月生存率(surv6m),数据类型:float64
- 字段名:住院天数(hday),数据类型:int64
- 字段名:糖尿病标识(diabetes),数据类型:int64
- 字段名:痴呆症标识(dementia),数据类型:int64
- 字段名:癌症标识(ca),数据类型:string
- 字段名:2个月预后评分(prg2m),数据类型:float64
- 字段名:6个月预后评分(prg6m),数据类型:float64
- 字段名:不复苏医嘱(dnr),数据类型:string
- 字段名:不复苏医嘱生效天数(dnrday),数据类型:float64
- 字段名:平均动脉压(meanbp),数据类型:float64
- 字段名:白细胞计数(wblc),数据类型:float64
- 字段名:心率(hrt),数据类型:float64
- 字段名:呼吸频率(resp),数据类型:float64
- 字段名:体温(temp),数据类型:float64
- 字段名:动脉血氧分压/吸入氧浓度比(pafi),数据类型:float64
- 字段名:白蛋白(alb),数据类型:float64
- 字段名:胆红素(bili),数据类型:float64
- 字段名:肌酐(crea),数据类型:float64
- 字段名:血钠浓度(sod),数据类型:float64
- 字段名:血液pH值(ph),数据类型:float64
- 字段名:血糖(glucose),数据类型:float64
- 字段名:血尿素氮(bun),数据类型:float64
- 字段名:尿量(urine),数据类型:float64
- 字段名:入院前日常生活活动能力评分(adlp),数据类型:float64
- 字段名:入院时日常生活活动能力评分(adls),数据类型:float64
- 字段名:简化功能障碍评分2(sfdm2),数据类型:string
- 字段名:校正后日常生活活动能力评分(adlsc),数据类型:float64
- 字段名:事件发生时间(event_times),数据类型:int64
- 字段名:事件发生标识(event_indicators),数据类型:int64
拆分设置:
- 拆分集:训练集(train),字节占用量:3753153,样本数量:9105
下载总大小:827762,数据集总存储大小:3753153
## 「support2」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jarrydmartinx
原始信息汇总
数据集概述
数据集特征
- age: 年龄,数据类型为
float64。 - sex: 性别,数据类型为
string。 - hospdead: 医院死亡,数据类型为
int64。 - slos: 住院天数,数据类型为
int64。 - dzgroup: 疾病组,数据类型为
string。 - dzclass: 疾病分类,数据类型为
string。 - num.co: 并发症数量,数据类型为
int64。 - edu: 教育水平,数据类型为
float64。 - income: 收入,数据类型为
string。 - scoma: 昏迷状态,数据类型为
float64。 - charges: 费用,数据类型为
float64。 - totcst: 总费用,数据类型为
float64。 - totmcst: 总医疗费用,数据类型为
float64。 - avtisst: 平均就诊时间,数据类型为
float64。 - race: 种族,数据类型为
string。 - sps: 简化生理评分,数据类型为
float64。 - aps: 急性生理评分,数据类型为
float64。 - surv2m: 2个月生存率,数据类型为
float64。 - surv6m: 6个月生存率,数据类型为
float64。 - hday: 假日,数据类型为
int64。 - diabetes: 糖尿病,数据类型为
int64。 - dementia: 痴呆,数据类型为
int64。 - ca: 癌症,数据类型为
string。 - prg2m: 2个月计划,数据类型为
float64。 - prg6m: 6个月计划,数据类型为
float64。 - dnr: 不复苏指令,数据类型为
string。 - dnrday: 不复苏指令日期,数据类型为
float64。 - meanbp: 平均血压,数据类型为
float64。 - wblc: 白细胞计数,数据类型为
float64。 - hrt: 心率,数据类型为
float64。 - resp: 呼吸频率,数据类型为
float64。 - temp: 体温,数据类型为
float64。 - pafi: 肺泡-动脉氧分压差,数据类型为
float64。 - alb: 白蛋白,数据类型为
float64。 - bili: 胆红素,数据类型为
float64。 - crea: 肌酐,数据类型为
float64。 - sod: 钠,数据类型为
float64。 - ph: pH值,数据类型为
float64。 - glucose: 血糖,数据类型为
float64。 - bun: 尿素氮,数据类型为
float64。 - urine: 尿量,数据类型为
float64。 - adlp: 日常生活活动能力,数据类型为
float64。 - adls: 日常生活活动评分,数据类型为
float64。 - sfdm2: 简短疾病量表,数据类型为
string。 - adlsc: 日常生活活动能力评分,数据类型为
float64。 - event_times: 事件时间,数据类型为
int64。 - event_indicators: 事件指示器,数据类型为
int64。
数据集分割
- train: 训练集,包含9105个样本,总大小为3753153字节。
数据集大小
- 下载大小: 827762字节。
- 数据集大小: 3753153字节。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个医疗相关的表格数据集,包含9,105条记录,涵盖患者年龄、性别、住院情况、疾病分类等多个维度的信息。数据集以parquet格式存储,适合用于医疗数据分析和研究。
以上内容由遇见数据集搜集并总结生成



