five

aisc-team-c1/MMedBench

收藏
Hugging Face2024-03-05 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/aisc-team-c1/MMedBench
下载链接
链接失效反馈
官方服务:
资源简介:
MMedBench是一个全面的多语言医学基准,包含45,048个用于训练的问答对和8,518个用于测试的问答对。每个样本包括一个问题、选项、正确答案以及选择正确答案的参考解释。数据集支持多种语言,包括英语、中文、日语、法语、俄语和西班牙语。数据以.jsonl文件格式提供,每个文件对应一种语言,每个样本包含问题、选项、答案索引、解释、人工检查状态和人工检查通过状态等属性。

MMedBench is a comprehensive multilingual medical benchmark comprising 45,048 QA pairs for training and 8,518 QA pairs for testing. Each sample includes a question, options, the correct answer, and a reference explanation for the selection of the correct answer. The dataset supports multiple languages including English, Chinese, Japanese, French, Russian, and Spanish. Each samples attributes include question, options, answer_idx, rationale, human_checked, and human_check_passed.
提供机构:
aisc-team-c1
原始信息汇总

MMedBench 数据集概述

基本信息

  • 许可证: cc-by-4.0
  • 语言:
    • 英语 (en)
    • 中文 (zh)
    • 日语 (ja)
    • 法语 (fr)
    • 俄语 (ru)
    • 西班牙语 (es)
  • 标签: medical
  • 任务类别: question-answering

数据配置

  • 西班牙语配置:
    • 数据文件: "Spanish.jsonl"
  • 英语配置:
    • 数据文件: "English.jsonl"

数据集介绍

  • 数据集名称: MMedBench
  • 数据类型: 多语种医学问答数据集
  • 数据量:
    • 训练集: 45,048 个 QA 对
    • 测试集: 8,518 个 QA 对
  • 数据格式:
    • 每个样本包含以下属性:
      • question: 问题字符串
      • options: 选项字典,键为索引 A,B,C,D,E,值为选项字符串
      • answer_idx: 正确答案索引字符串,每个索引用逗号分隔
      • rationale: 选择正确答案的解释字符串
      • human_checked: 是否已手动检查解释
      • human_check_passed: 解释是否通过手动检查

数据访问

  • 下载链接: MMedBench.zip
  • 文件结构:
    • 包含两个文件夹: Train 和 Test
    • 每个文件夹包含六个 .jsonl 文件,每个文件对应一种语言
    • 每行代表一个样本

评估结果

  • 评估模型:
    • GPT-3.5, GPT-4, Gemini-1.0 pro, BLOOMZ, InternLM, Llama 2, MedAlpaca, ChatDoctor, PMC-LLaMA, Mistral, InternLM 2, MMedLM, MMedLM 2
  • 评估指标:
    • 各模型在不同语言上的表现
  • 评估设置:
    • GPT 和 Gemini 在零样本设置下通过 API 评估
    • 开源模型首先在 MMedBench 训练集上进行训练,然后进行评估

联系信息

  • 联系方式: qiupengcheng@pjlab.org.cn

引用

@misc{qiu2024building, title={Towards Building Multilingual Language Model for Medicine}, author={Pengcheng Qiu and Chaoyi Wu and Xiaoman Zhang and Weixiong Lin and Haicheng Wang and Ya Zhang and Yanfeng Wang and Weidi Xie}, year={2024}, eprint={2402.13963}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作