five

HiTZ/casimedicos-squad

收藏
Hugging Face2024-04-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/casimedicos-squad
下载链接
链接失效反馈
官方服务:
资源简介:
casimedicos-squad数据集是一个多语言的医学考试数据集,主要包含西班牙语的医学考试题目及其解释。该数据集旨在通过SQuAD抽取式问答范式,自动评估语言模型在医学考试中识别正确答案解释的能力,从而减少对医学专家手动评估的依赖。数据集来源于CasiMedicos社区,该社区由西班牙医学专业人士组成,他们自愿免费发布关于MIR考试答案的解释。数据集经过提取、清理、结构化和注释,每个文档包括临床案例、正确答案、多项选择题以及由西班牙本土医学医生撰写的考试评论。评论中标注了与正确答案解释对应的文本片段。数据集分为训练集、验证集和测试集,分别包含404、56和119个文档。

casimedicos-squad数据集是一个多语言的医学考试数据集,主要包含西班牙语的医学考试题目及其解释。该数据集旨在通过SQuAD抽取式问答范式,自动评估语言模型在医学考试中识别正确答案解释的能力,从而减少对医学专家手动评估的依赖。数据集来源于CasiMedicos社区,该社区由西班牙医学专业人士组成,他们自愿免费发布关于MIR考试答案的解释。数据集经过提取、清理、结构化和注释,每个文档包括临床案例、正确答案、多项选择题以及由西班牙本土医学医生撰写的考试评论。评论中标注了与正确答案解释对应的文本片段。数据集分为训练集、验证集和测试集,分别包含404、56和119个文档。
提供机构:
HiTZ
原始信息汇总

数据集概述

数据集名称

  • casimedicos-squad

许可证

  • CC-BY-4.0

语言

  • 西班牙语 (es)

标签

  • casimedicos
  • explainability
  • medical exams
  • medical question answering
  • extractive question answering
  • squad
  • multilinguality
  • LLMs
  • LLM

配置

  • config_name: es
    • train: data/es/es_train_casimedicos_squad.json
    • validation: data/es/es_dev_casimedicos_squad.json
    • test: data/es/es_test_casimedicos_squad.json

任务类别

  • question-answering

大小类别

  • 1K<n<10K

数据集内容

  • 包含临床案例、正确答案、多项选择题及由西班牙语医学专家编写的评论考试。
  • 评论中标注了正确答案解释的文本范围。

数据集结构

  • context: 文档中的解释(E)
  • qas: 可能的答案和问题列表
    • answers: 正确答案的解释(A)
    • question: 临床案例(C)和问题(Q)
    • id: 文档的唯一标识符

数据集示例

  • 示例展示了包含文本内容(临床案例、问题、可能答案和解释)的文档,并标注了正确答案解释的文本范围。

数据集引用

联系信息

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作