Shekswess/medical_llama2_instruct_dataset_short
收藏Hugging Face2024-04-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Shekswess/medical_llama2_instruct_dataset_short
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于指令监督微调Llama 2 LLMs,结合了Medical Meadow Wikidoc和Medquad两个医疗数据集,并从中提取了2000条数据。Medical Meadow Wikidoc数据集包含从WikiDoc平台提取的问答对,WikiDoc是一个医疗专业人士共享当代医学知识的在线平台。Medquad数据集则包含来自美国国立卫生研究院(NIH)12个权威来源的47,457个医疗问答对,涵盖了广泛的医疗主题。
该数据集用于指令监督微调Llama 2 LLMs,结合了Medical Meadow Wikidoc和Medquad两个医疗数据集,并从中提取了2000条数据。Medical Meadow Wikidoc数据集包含从WikiDoc平台提取的问答对,WikiDoc是一个医疗专业人士共享当代医学知识的在线平台。Medquad数据集则包含来自美国国立卫生研究院(NIH)12个权威来源的47,457个医疗问答对,涵盖了广泛的医疗主题。
提供机构:
Shekswess
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 大小分类: 1K<n<10K
- 任务分类: 问答
数据集特征
- output: 字符串类型
- input: 字符串类型
- instruction: 字符串类型
- prompt: 字符串类型
数据集划分
- 训练集:
- 示例数量: 2000
- 字节数: 4150252
数据集大小
- 下载大小: 1914302字节
- 数据集大小: 4150252字节
配置
- 默认配置:
- 训练数据路径: data/train-*
标签
- 医学



