five

LenguajeNaturalAI/ClinDiagnosES

收藏
Hugging Face2024-05-22 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/LenguajeNaturalAI/ClinDiagnosES
下载链接
链接失效反馈
官方服务:
资源简介:
ClinDiagnosES数据集是一个用于医学领域的问答、文本生成和文本到文本生成任务的数据集。它包含62个训练样本,每个样本包含三个特征:caso_clinico(临床案例)、Diagnostico(诊断)和Especialidad(专业领域)。数据集由多个健康领域的专业人士合作构建,包括心脏病学、创伤学、急诊、精神病学、神经学、皮肤病学、耳鼻喉科学和麻醉学。数据集的许可证为CC BY-NC-SA 4.0,由LenguajeNatural.AI、IE University和多位健康专业人士共同贡献。

ClinDiagnosES数据集是一个用于医学领域的问答、文本生成和文本到文本生成任务的数据集。它包含62个训练样本,每个样本包含三个特征:caso_clinico(临床案例)、Diagnostico(诊断)和Especialidad(专业领域)。数据集由多个健康领域的专业人士合作构建,包括心脏病学、创伤学、急诊、精神病学、神经学、皮肤病学、耳鼻喉科学和麻醉学。数据集的许可证为CC BY-NC-SA 4.0,由LenguajeNatural.AI、IE University和多位健康专业人士共同贡献。
提供机构:
LenguajeNaturalAI
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • caso_clinico: 字符串类型
    • Diagnostico: 字符串类型
    • Especialidad: 字符串类型
  • 分割:
    • train: 包含62个样本,占用47156字节
  • 下载大小: 33848字节
  • 数据集大小: 47156字节
  • 配置:
    • default: 数据文件路径为data/train-*
  • 许可证: CC BY-NC-SA 4.0
  • 任务类别:
    • 问答
    • 文本生成
    • 文本到文本生成
  • 语言: 西班牙语
  • 标签:
    • 医学
    • 生物学
  • 易读名称: ClinDiagnosES
  • 大小类别: n<1K

数据集构建

  • 该语料库由来自不同医疗领域的专业人士构建,包括心脏病学、创伤学、急诊医学、精神病学、神经学、皮肤病学、耳鼻喉科学和麻醉学。

使用指南

  • 该数据集的模板用于评估LLMs在该任务上的性能,具体使用方法如下: python prompt_template="""A partir del caso clínico que se expone a continuación, tu tarea es la siguiente. Como médico experto, tu tarea es la de diagnosticar al paciente en base al caso clínico. Responde únicamente con el diagnóstico para el paciente de forma concisa. Caso clínico: {caso_clinico} """

    cómo usarlo con un LLM:

    system_prompt = "Eres un experto en medicina que realiza diagnósticos en base a casos clínicos."

    messages = [ {"role": "system", "content": system_prompt}, {"role": "user", "content": prompt_template.format(caso_clinico=caso_clinico)} ]

    mssg = tokenizer.apply_chat_template(messages, tokenize=False)

许可证

  • 该数据集使用CC BY-NC-SA 4.0许可证。

引用

  • 引用该数据集的格式如下:

    @software{clindiagnoses24, author = {LenguajeNatural.AI}, title = {ClinDiagnosES}, month = March, year = 2024, url = {https://huggingface.co/datasets/LenguajeNaturalAI/ClinDiagnosES} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作