five

Laurent1/MedQuad-MedicalQnADataset_128tokens_max

收藏
Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Laurent1/MedQuad-MedicalQnADataset_128tokens_max
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含医学问题及其相应的回答,以提示格式呈现,适用于聊天或指导模型类型。为了在硬件资源有限的情况下微调大型语言模型,删除了超过128个标记的行,并将行截断到换行符或句子结束处,以保持正确的意义。这是对Keivalya Pandya数据集的更新。
提供机构:
Laurent1
原始信息汇总

数据集概述

许可证

  • Apache-2.0

任务类别

  • 问答
  • 文本生成

语言

  • 英语

数据规模

  • 10K<n<100K

内容描述

  • 包含医学问题及其对应的回答,格式为聊天或指令模型类型。
  • 为了在小硬件(1或2个GPU,每个14GB)上微调大型语言模型(LLM),删除了超过128个令牌的行。
  • 行被截断到换行符或句子结束,以保持正确的意义。

下载脚本

python from datasets import load_dataset dataset_name = "Laurent1/MedQuad-MedicalQnADataset_128tokens_max" dataset = load_dataset(dataset_name, split="train")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作