MedQuAD
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/abachaa/medquad
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了来自120ask问答社区的17,387条医疗问题,这些问题被归类为20个不同的类别。数据集按照训练集(60%)、验证集(20%)和测试集(20%)的比例进行划分,采用随机分区的形式。规模上,该数据集覆盖了20个类别的17,387条问题,任务是对这些问题进行分类。
This dataset includes 17,387 medical questions sourced from the 120ask Q&A community, with all questions categorized into 20 distinct categories. It is randomly partitioned into three subsets: 60% for training, 20% for validation, and 20% for testing. Covering 17,387 questions across 20 categories, the task of this dataset is to classify these medical questions.
提供机构:
120ask
搜集汇总
数据集介绍

背景与挑战
背景概述
MedQuAD是一个包含47,457个医学问答对的数据集,来源于12个NIH网站,涵盖多种医学问题类型,并附带丰富注释。数据集还包括一个测试集,用于评估问答系统的性能。
以上内容由遇见数据集搜集并总结生成



