five

cmcmaster/clinical_cases_for_generation

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/cmcmaster/clinical_cases_for_generation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与患者相关的多种信息,如患者ID、唯一标识符、PMID、文件路径、标题、患者详细信息、年龄、性别、相关文章、相似患者、摘要、提示和消息等。数据集分为训练集,包含3000个样本,总大小为19334929字节。数据集的下载大小为10906301字节。

This dataset contains various information related to patients, such as patient ID, unique identifier, PMID, file path, title, patient details, age, gender, relevant articles, similar patients, summary, prompt, and messages. The dataset is divided into a training set containing 3000 samples, with a total size of 19334929 bytes. The download size of the dataset is 10906301 bytes.
提供机构:
cmcmaster
原始信息汇总

数据集概述

数据集信息

特征

  • patient_id: 数据类型为 int64
  • patient_uid: 数据类型为 string
  • PMID: 数据类型为 int64
  • file_path: 数据类型为 string
  • title: 数据类型为 string
  • patient: 数据类型为 string
  • age: 数据类型为 string
  • gender: 数据类型为 string
  • relevant_articles: 数据类型为 string
  • similar_patients: 数据类型为 string
  • summary: 数据类型为 string,且为序列类型
  • prompt: 数据类型为 string
  • messages: 包含以下子特征的列表:
    • content: 数据类型为 string
    • role: 数据类型为 string

数据分割

  • train: 包含 3000 个样本,总字节数为 19334929

数据集大小

  • 下载大小: 10906301 字节
  • 数据集大小: 19334929 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作