cmcmaster/clinical_cases_for_generation
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/cmcmaster/clinical_cases_for_generation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与患者相关的多种信息,如患者ID、唯一标识符、PMID、文件路径、标题、患者详细信息、年龄、性别、相关文章、相似患者、摘要、提示和消息等。数据集分为训练集,包含3000个样本,总大小为19334929字节。数据集的下载大小为10906301字节。
This dataset contains various information related to patients, such as patient ID, unique identifier, PMID, file path, title, patient details, age, gender, relevant articles, similar patients, summary, prompt, and messages. The dataset is divided into a training set containing 3000 samples, with a total size of 19334929 bytes. The download size of the dataset is 10906301 bytes.
提供机构:
cmcmaster
原始信息汇总
数据集概述
数据集信息
特征
- patient_id: 数据类型为
int64 - patient_uid: 数据类型为
string - PMID: 数据类型为
int64 - file_path: 数据类型为
string - title: 数据类型为
string - patient: 数据类型为
string - age: 数据类型为
string - gender: 数据类型为
string - relevant_articles: 数据类型为
string - similar_patients: 数据类型为
string - summary: 数据类型为
string,且为序列类型 - prompt: 数据类型为
string - messages: 包含以下子特征的列表:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
数据分割
- train: 包含 3000 个样本,总字节数为 19334929
数据集大小
- 下载大小: 10906301 字节
- 数据集大小: 19334929 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



