LenguajeNaturalAI/ClinDiagnosES
收藏数据集概述
数据集信息
- 特征:
caso_clinico: 字符串类型Diagnostico: 字符串类型Especialidad: 字符串类型
- 分割:
train: 包含62个样本,占用47156字节
- 下载大小: 33848字节
- 数据集大小: 47156字节
- 配置:
default: 数据文件路径为data/train-*
- 许可证: CC BY-NC-SA 4.0
- 任务类别:
- 问答
- 文本生成
- 文本到文本生成
- 语言: 西班牙语
- 标签:
- 医学
- 生物学
- 易读名称: ClinDiagnosES
- 大小类别: n<1K
数据集构建
- 该语料库由来自不同医疗领域的专业人士构建,包括心脏病学、创伤学、急诊医学、精神病学、神经学、皮肤病学、耳鼻喉科学和麻醉学。
使用指南
-
该数据集的模板用于评估LLMs在该任务上的性能,具体使用方法如下: python prompt_template="""A partir del caso clínico que se expone a continuación, tu tarea es la siguiente. Como médico experto, tu tarea es la de diagnosticar al paciente en base al caso clínico. Responde únicamente con el diagnóstico para el paciente de forma concisa. Caso clínico: {caso_clinico} """
cómo usarlo con un LLM:
system_prompt = "Eres un experto en medicina que realiza diagnósticos en base a casos clínicos."
messages = [ {"role": "system", "content": system_prompt}, {"role": "user", "content": prompt_template.format(caso_clinico=caso_clinico)} ]
mssg = tokenizer.apply_chat_template(messages, tokenize=False)
许可证
- 该数据集使用CC BY-NC-SA 4.0许可证。
引用
-
引用该数据集的格式如下:
@software{clindiagnoses24, author = {LenguajeNatural.AI}, title = {ClinDiagnosES}, month = March, year = 2024, url = {https://huggingface.co/datasets/LenguajeNaturalAI/ClinDiagnosES} }



