dischargesum/discharge
收藏Hugging Face2024-03-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/dischargesum/discharge
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: note_id
dtype: string
- name: subject_id
dtype: int64
- name: hadm_id
dtype: int64
- name: note_type
dtype: string
- name: note_seq
dtype: int64
- name: charttime
dtype: string
- name: storetime
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 819984570
num_examples: 68785
- name: valid
num_bytes: 175587970
num_examples: 14719
- name: test
num_bytes: 175217036
num_examples: 14702
download_size: 642461911
dataset_size: 1170789576
---
# Dataset Card for "discharge"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息(dataset_info):
特征:
- 名称: 记录ID(note_id)
数据类型: 字符串(string)
- 名称: 受试者ID(subject_id)
数据类型: 64位整数(int64)
- 名称: 住院ID(hadm_id)
数据类型: 64位整数(int64)
- 名称: 记录类型(note_type)
数据类型: 字符串(string)
- 名称: 记录序号(note_seq)
数据类型: 64位整数(int64)
- 名称: 记录时间(charttime)
数据类型: 字符串(string)
- 名称: 存储时间(storetime)
数据类型: 字符串(string)
- 名称: 文本内容(text)
数据类型: 字符串(string)
数据集划分:
- 名称: 训练集(train)
字节大小: 819,984,570
样本数量: 68,785
- 名称: 验证集(valid)
字节大小: 175,587,970
样本数量: 14,719
- 名称: 测试集(test)
字节大小: 175,217,036
样本数量: 14,702
下载大小: 642,461,911
数据集总大小: 1,170,789,576
---
# "出院"数据集卡片(Dataset Card)
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dischargesum
原始信息汇总
数据集概述
数据集特征
- note_id: 数据类型为字符串。
- subject_id: 数据类型为整数64位。
- hadm_id: 数据类型为整数64位。
- note_type: 数据类型为字符串。
- note_seq: 数据类型为整数64位。
- charttime: 数据类型为字符串。
- storetime: 数据类型为字符串。
- text: 数据类型为字符串。
数据集分割
- 训练集 (train): 包含68785个样本,总大小为819984570字节。
- 验证集 (valid): 包含14719个样本,总大小为175587970字节。
- 测试集 (test): 包含14702个样本,总大小为175217036字节。
数据集大小
- 下载大小: 642461911字节。
- 数据集总大小: 1170789576字节。



