five

HiTZ/casimedicos-exp

收藏
Hugging Face2024-03-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/casimedicos-exp
下载链接
链接失效反馈
官方服务:
资源简介:
Antidote CasiMedicos数据集是一个多语言的医学考试数据集,包含了医学考试中的问题和答案的解释。数据集来源于西班牙的CasiMedicos社区,该社区的医学专业人员为MIR考试提供了详细的解释。数据集包括临床案例、问题、可能的答案以及解释,并且已经翻译成英语、法语、意大利语和西班牙语四种语言。数据集可以用于多种NLP任务,如医学问答、解释性论据提取或解释生成。

Antidote CasiMedicos数据集是一个多语言的医学考试数据集,包含了医学考试中的问题和答案的解释。数据集来源于西班牙的CasiMedicos社区,该社区的医学专业人员为MIR考试提供了详细的解释。数据集包括临床案例、问题、可能的答案以及解释,并且已经翻译成英语、法语、意大利语和西班牙语四种语言。数据集可以用于多种NLP任务,如医学问答、解释性论据提取或解释生成。
提供机构:
HiTZ
原始信息汇总

数据集概述

数据集名称

  • casimedicos-exp

许可证

  • CC-BY-4.0

语言

  • 英语 (en)
  • 西班牙语 (es)
  • 法语 (fr)
  • 意大利语 (it)

标签

  • casimedicos
  • explainability
  • medical exams
  • medical question answering
  • multilinguality
  • LLMs
  • LLM

任务类别

  • 文本生成
  • 问答

大小类别

  • 1K<n<10K

数据文件配置

  • 英语 (en)
    • 训练集: data/en/en_train_casimedicos.jsonl
    • 验证集: data/en/en_dev_casimedicos.jsonl
    • 测试集: data/en/en_test_casimedicos.jsonl
  • 西班牙语 (es)
    • 训练集: data/es/es_train_casimedicos.jsonl
    • 验证集: data/es/es_dev_casimedicos.jsonl
    • 测试集: data/es/es_test_casimedicos.jsonl
  • 法语 (fr)
    • 训练集: data/fr/fr_train_casimedicos.jsonl
    • 验证集: data/fr/fr_dev_casimedicos.jsonl
    • 测试集: data/fr/fr_test_casimedicos.jsonl
  • 意大利语 (it)
    • 训练集: data/it/it_train_casimedicos.jsonl
    • 验证集: data/it/it_dev_casimedicos.jsonl
    • 测试集: data/it/it_test_casimedicos.jsonl

数据集内容

  • casimedicos-raw: 包含临床案例、问题、可能的答案和注释解释的文本内容。
  • casimedicos-exp: 手动注释,链接正确和错误可能答案的解释。

数据集属性

  • casimedicos-raw
    • id: 唯一文档标识符。
    • year: 考试发布的年份。
    • question_id_specific: 原始考试的标识符。
    • full_question: 临床案例和问题。
    • full_answer: 完整注释解释。
    • type: 医学专业。
    • options: 可能的答案。
    • correct_option: 考试问题的答案。
  • casimedicos-exp
    • explanations: 每个可能答案的解释,包括是否存在解释、字符和令牌偏移量及解释文本。

引用信息

  • 使用casimedicos-raw时,请引用以下论文: bibtex @inproceedings{Agerri2023HiTZAntidoteAE, title={HiTZ@Antidote: Argumentation-driven Explainable Artificial Intelligence for Digital Medicine}, author={Rodrigo Agerri and I{~n}igo Alonso and Aitziber Atutxa and Ander Berrondo and Ainara Estarrona and Iker Garc{i}a-Ferrero and Iakes Goenaga and Koldo Gojenola and Maite Oronoz and Igor Perez-Tejedor and German Rigau and Anar Yeginbergenova}, booktitle={SEPLN 2023: 39th International Conference of the Spanish Society for Natural Language Processing.}, year={2023} }

  • 使用casimedicos-exp时,请引用以下论文: bibtex @misc{goenaga2023explanatory, title={Explanatory Argument Extraction of Correct Answers in Resident Medical Exams}, author={Iakes Goenaga and Aitziber Atutxa and Koldo Gojenola and Maite Oronoz and Rodrigo Agerri}, year={2023}, eprint={2312.00567}, archivePrefix={arXiv} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作