qanastek/LLaMaInstructionsFrenchMedMCQA
收藏Hugging Face2023-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/qanastek/LLaMaInstructionsFrenchMedMCQA
下载链接
链接失效反馈官方服务:
资源简介:
FrenchMedMCQA是第一个公开的法语医学领域多项选择题问答数据集,包含3,105个问题,这些问题来自法国药学专业文凭的真实考试,问题类型包括单选和多选。每个数据实例包含一个标识符、一个问题、五个可能的答案及其手动修正。数据集还提供了基线模型,用于自动处理MCQA任务,并展示了当前性能及任务的难度。分析结果表明,尽管数据集是法语的,但英语专业模型的表现优于通用法语模型。
FrenchMedMCQA是第一个公开的法语医学领域多项选择题问答数据集,包含3,105个问题,这些问题来自法国药学专业文凭的真实考试,问题类型包括单选和多选。每个数据实例包含一个标识符、一个问题、五个可能的答案及其手动修正。数据集还提供了基线模型,用于自动处理MCQA任务,并展示了当前性能及任务的难度。分析结果表明,尽管数据集是法语的,但英语专业模型的表现优于通用法语模型。
提供机构:
qanastek
原始信息汇总
数据集概述
数据集名称
- Pretty Name: FrenchMedMCQA
- Full Name: FrenchMedMCQA: A French Multiple-Choice Question Answering Corpus for Medical domain
数据集属性
- 语言: 法语 (fr)
- 许可证: Apache-2.0
- 多语言性: 单语种
- 大小类别: 1k<n<10k
- 源数据集: 原始数据
- 任务类别: 问答、多选题
- 任务ID: multiple-choice-qa, open-domain-qa
- Paperswithcode ID: frenchmedmcqa
数据集描述
- 概述: FrenchMedMCQA是首个公开的法语医学领域多选题问答数据集,包含3,105个问题,来自法国药学专业文凭的真实考试。
- 数据实例结构: 每个实例包含一个标识符、一个问题、五个可能的答案及其手动校正。
- 支持任务: 多选题问答 (MCQA)
数据集结构
- 数据字段:
id: 问题标识符prompt: 用于LLaMa的提示文本correct_answers: 正确选项
- 数据分割:
- 训练、验证和测试集的详细分割,根据答案数量分类。
数据集创建
- 源数据: 问题和答案从remede网站上的真实法国药学考试中收集,由医学专家手动创建。
- 个人信息和敏感信息: 数据集不含个人或敏感信息。
附加信息
- 数据集创建者: Labrak Yanis, Bazoge Adrien, Dufour Richard, Daille Beatrice, Gourraud Pierre-Antoine, Morin Emmanuel, Rouvier Mickael
- 许可证信息: Apache 2.0
- 引用信息: 提供详细的引用格式和信息。
- 联系信息: 可通过Yanis LABRAK获取更多信息。



