Laurent1/MedQuad-MedicalQnADataset_128tokens_max
收藏Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Laurent1/MedQuad-MedicalQnADataset_128tokens_max
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含医学问题及其相应的回答,以提示格式呈现,适用于聊天或指导模型类型。为了在硬件资源有限的情况下微调大型语言模型,删除了超过128个标记的行,并将行截断到换行符或句子结束处,以保持正确的意义。这是对Keivalya Pandya数据集的更新。
提供机构:
Laurent1
原始信息汇总
数据集概述
许可证
- Apache-2.0
任务类别
- 问答
- 文本生成
语言
- 英语
数据规模
- 10K<n<100K
内容描述
- 包含医学问题及其对应的回答,格式为聊天或指令模型类型。
- 为了在小硬件(1或2个GPU,每个14GB)上微调大型语言模型(LLM),删除了超过128个令牌的行。
- 行被截断到换行符或句子结束,以保持正确的意义。
下载脚本
python from datasets import load_dataset dataset_name = "Laurent1/MedQuad-MedicalQnADataset_128tokens_max" dataset = load_dataset(dataset_name, split="train")



