five

qanastek/LLaMaInstructionsFrenchMedMCQA

收藏
Hugging Face2023-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/qanastek/LLaMaInstructionsFrenchMedMCQA
下载链接
链接失效反馈
官方服务:
资源简介:
FrenchMedMCQA是第一个公开的法语医学领域多项选择题问答数据集,包含3,105个问题,这些问题来自法国药学专业文凭的真实考试,问题类型包括单选和多选。每个数据实例包含一个标识符、一个问题、五个可能的答案及其手动修正。数据集还提供了基线模型,用于自动处理MCQA任务,并展示了当前性能及任务的难度。分析结果表明,尽管数据集是法语的,但英语专业模型的表现优于通用法语模型。

FrenchMedMCQA是第一个公开的法语医学领域多项选择题问答数据集,包含3,105个问题,这些问题来自法国药学专业文凭的真实考试,问题类型包括单选和多选。每个数据实例包含一个标识符、一个问题、五个可能的答案及其手动修正。数据集还提供了基线模型,用于自动处理MCQA任务,并展示了当前性能及任务的难度。分析结果表明,尽管数据集是法语的,但英语专业模型的表现优于通用法语模型。
提供机构:
qanastek
原始信息汇总

数据集概述

数据集名称

  • Pretty Name: FrenchMedMCQA
  • Full Name: FrenchMedMCQA: A French Multiple-Choice Question Answering Corpus for Medical domain

数据集属性

  • 语言: 法语 (fr)
  • 许可证: Apache-2.0
  • 多语言性: 单语种
  • 大小类别: 1k<n<10k
  • 源数据集: 原始数据
  • 任务类别: 问答、多选题
  • 任务ID: multiple-choice-qa, open-domain-qa
  • Paperswithcode ID: frenchmedmcqa

数据集描述

  • 概述: FrenchMedMCQA是首个公开的法语医学领域多选题问答数据集,包含3,105个问题,来自法国药学专业文凭的真实考试。
  • 数据实例结构: 每个实例包含一个标识符、一个问题、五个可能的答案及其手动校正。
  • 支持任务: 多选题问答 (MCQA)

数据集结构

  • 数据字段:
    • id: 问题标识符
    • prompt: 用于LLaMa的提示文本
    • correct_answers: 正确选项
  • 数据分割:
    • 训练、验证和测试集的详细分割,根据答案数量分类。

数据集创建

  • 源数据: 问题和答案从remede网站上的真实法国药学考试中收集,由医学专家手动创建。
  • 个人信息和敏感信息: 数据集不含个人或敏感信息。

附加信息

  • 数据集创建者: Labrak Yanis, Bazoge Adrien, Dufour Richard, Daille Beatrice, Gourraud Pierre-Antoine, Morin Emmanuel, Rouvier Mickael
  • 许可证信息: Apache 2.0
  • 引用信息: 提供详细的引用格式和信息。
  • 联系信息: 可通过Yanis LABRAK获取更多信息。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作