ofir408/prev_format_MedConceptsQA
收藏Hugging Face2024-05-14 更新2024-06-26 收录
下载链接:
https://hf-mirror.com/datasets/ofir408/prev_format_MedConceptsQA
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question_id
dtype: int64
- name: answer
dtype: string
- name: answer_id
dtype: string
- name: option1
dtype: string
- name: option2
dtype: string
- name: option3
dtype: string
- name: option4
dtype: string
- name: question
dtype: string
- name: vocab
dtype: string
- name: level
dtype: string
splits:
- name: train
num_bytes: 687725968
num_examples: 819772
- name: dev
num_bytes: 37454
num_examples: 60
download_size: 247545663
dataset_size: 687763422
license: apache-2.0
task_categories:
- question-answering
language:
- en
tags:
- medical
pretty_name: MedConceptsQA
size_categories:
- 100K<n<1M
---
# Dataset Card for "MedConceptsQA"
The benchmark of the paper "**MedConceptsQA - Open Source Medical Concepts QA Benchmark**".
Paper Link:
https://arxiv.org/abs/2405.07348
Our evaluation code is available at https://github.com/nadavlab/MedConceptsQA
数据集信息:
特征:
- 问题ID(question_id):数据类型为int64
- 答案(answer):数据类型为字符串
- 答案标识符(answer_id):数据类型为字符串
- 选项1(option1):数据类型为字符串
- 选项2(option2):数据类型为字符串
- 选项3(option3):数据类型为字符串
- 选项4(option4):数据类型为字符串
- 问题(question):数据类型为字符串
- 词汇表(vocab):数据类型为字符串
- 难度等级(level):数据类型为字符串
数据集划分:
- 训练集(train):占用字节数687725968,样本量819772
- 开发集(dev):占用字节数37454,样本量60
下载大小:247545663,数据集总大小:687763422
许可证:Apache-2.0
任务类别:问答(question-answering)
语言:英语(en)
标签:医疗(medical)
展示名称:MedConceptsQA
样本规模区间:10万 < n < 100万
# MedConceptsQA 数据集卡片
本数据集为论文《MedConceptsQA——开源医疗概念问答基准》所配套的基准测试集。
论文链接:https://arxiv.org/abs/2405.07348
本数据集的评估代码可在 https://github.com/nadavlab/MedConceptsQA 获取
提供机构:
ofir408
原始信息汇总
数据集概述
数据集信息
-
特征列表:
question_id: 数据类型为int64answer: 数据类型为stringanswer_id: 数据类型为stringoption1: 数据类型为stringoption2: 数据类型为stringoption3: 数据类型为stringoption4: 数据类型为stringquestion: 数据类型为stringvocab: 数据类型为stringlevel: 数据类型为string
-
数据分割:
train: 字节数为 687725968,样本数为 819772dev: 字节数为 37454,样本数为 60
-
数据集大小:
- 下载大小: 247545663 字节
- 数据集大小: 687763422 字节
-
许可证: apache-2.0
-
任务类别:
- 问答系统
-
语言:
- 英语
-
标签:
- 医学
-
数据集名称: MedConceptsQA
-
数据集规模: 100K<n<1M
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



