HiTZ/casimedicos-squad
收藏Hugging Face2024-04-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/casimedicos-squad
下载链接
链接失效反馈官方服务:
资源简介:
casimedicos-squad数据集是一个多语言的医学考试数据集,主要包含西班牙语的医学考试题目及其解释。该数据集旨在通过SQuAD抽取式问答范式,自动评估语言模型在医学考试中识别正确答案解释的能力,从而减少对医学专家手动评估的依赖。数据集来源于CasiMedicos社区,该社区由西班牙医学专业人士组成,他们自愿免费发布关于MIR考试答案的解释。数据集经过提取、清理、结构化和注释,每个文档包括临床案例、正确答案、多项选择题以及由西班牙本土医学医生撰写的考试评论。评论中标注了与正确答案解释对应的文本片段。数据集分为训练集、验证集和测试集,分别包含404、56和119个文档。
casimedicos-squad数据集是一个多语言的医学考试数据集,主要包含西班牙语的医学考试题目及其解释。该数据集旨在通过SQuAD抽取式问答范式,自动评估语言模型在医学考试中识别正确答案解释的能力,从而减少对医学专家手动评估的依赖。数据集来源于CasiMedicos社区,该社区由西班牙医学专业人士组成,他们自愿免费发布关于MIR考试答案的解释。数据集经过提取、清理、结构化和注释,每个文档包括临床案例、正确答案、多项选择题以及由西班牙本土医学医生撰写的考试评论。评论中标注了与正确答案解释对应的文本片段。数据集分为训练集、验证集和测试集,分别包含404、56和119个文档。
提供机构:
HiTZ
原始信息汇总
数据集概述
数据集名称
- casimedicos-squad
许可证
- CC-BY-4.0
语言
- 西班牙语 (es)
标签
- casimedicos
- explainability
- medical exams
- medical question answering
- extractive question answering
- squad
- multilinguality
- LLMs
- LLM
配置
- config_name: es
- train: data/es/es_train_casimedicos_squad.json
- validation: data/es/es_dev_casimedicos_squad.json
- test: data/es/es_test_casimedicos_squad.json
任务类别
- question-answering
大小类别
- 1K<n<10K
数据集内容
- 包含临床案例、正确答案、多项选择题及由西班牙语医学专家编写的评论考试。
- 评论中标注了正确答案解释的文本范围。
数据集结构
- context: 文档中的解释(E)
- qas: 可能的答案和问题列表
- answers: 正确答案的解释(A)
- question: 临床案例(C)和问题(Q)
- id: 文档的唯一标识符
数据集示例
- 示例展示了包含文本内容(临床案例、问题、可能答案和解释)的文档,并标注了正确答案解释的文本范围。
数据集引用
- 引用文献:Explanatory Argument Extraction of Correct Answers in Resident Medical Exams
- 作者:Iakes Goenaga, Aitziber Atutxa, Koldo Gojenola, Maite Oronoz, Rodrigo Agerri
- 年份:2023
联系信息
- Iakes Goenaga: http://www.hitz.eus/es/node/65
- Rodrigo Agerri: https://ragerri.github.io/
- HiTZ Center - Ixa, University of the Basque Country UPV/EHU



