JamBelg/Argilla_prompt_llm
收藏Hugging Face2024-04-02 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/JamBelg/Argilla_prompt_llm
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Text
dtype: string
- name: ' Cardiovascular / Pulmonary'
dtype: int64
- name: ' Consult - History and Phy.'
dtype: int64
- name: ' Discharge Summary'
dtype: int64
- name: ' ENT - Otolaryngology'
dtype: int64
- name: ' Emergency Room Reports'
dtype: int64
- name: ' Gastroenterology'
dtype: int64
- name: ' General Medicine'
dtype: int64
- name: ' Hematology - Oncology'
dtype: int64
- name: ' Nephrology'
dtype: int64
- name: ' Neurology'
dtype: int64
- name: ' Neurosurgery'
dtype: int64
- name: ' Obstetrics / Gynecology'
dtype: int64
- name: ' Ophthalmology'
dtype: int64
- name: ' Orthopedic'
dtype: int64
- name: ' Pain Management'
dtype: int64
- name: ' Pediatrics - Neonatal'
dtype: int64
- name: ' Radiology'
dtype: int64
- name: ' SOAP / Chart / Progress Notes'
dtype: int64
- name: ' Surgery'
dtype: int64
- name: ' Urology'
dtype: int64
- name: clean_text
dtype: string
- name: words_count
dtype: int64
- name: prompt
dtype: string
splits:
- name: train
num_bytes: 19304996
num_examples: 2316
download_size: 9570856
dataset_size: 19304996
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
JamBelg
原始信息汇总
数据集概述
数据集特征
- Text:文本类型,数据类型为字符串。
- Cardiovascular / Pulmonary:整数类型,数据类型为int64。
- Consult - History and Phy.:整数类型,数据类型为int64。
- Discharge Summary:整数类型,数据类型为int64。
- ENT - Otolaryngology:整数类型,数据类型为int64。
- Emergency Room Reports:整数类型,数据类型为int64。
- Gastroenterology:整数类型,数据类型为int64。
- General Medicine:整数类型,数据类型为int64。
- Hematology - Oncology:整数类型,数据类型为int64。
- Nephrology:整数类型,数据类型为int64。
- Neurology:整数类型,数据类型为int64。
- Neurosurgery:整数类型,数据类型为int64。
- Obstetrics / Gynecology:整数类型,数据类型为int64。
- Ophthalmology:整数类型,数据类型为int64。
- Orthopedic:整数类型,数据类型为int64。
- Pain Management:整数类型,数据类型为int64。
- Pediatrics - Neonatal:整数类型,数据类型为int64。
- Radiology:整数类型,数据类型为int64。
- SOAP / Chart / Progress Notes:整数类型,数据类型为int64。
- Surgery:整数类型,数据类型为int64。
- Urology:整数类型,数据类型为int64。
- clean_text:文本类型,数据类型为字符串。
- words_count:整数类型,数据类型为int64。
- prompt:文本类型,数据类型为字符串。
数据集分割
- train:训练集,包含2316个样本,总大小为19304996字节。
数据集大小
- 下载大小:9570856字节。
- 数据集大小:19304996字节。
配置
- config_name:default
- data_files:
- split:train
- path:data/train-*



