five

MedQuAD

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/abachaa/medquad
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了来自120ask问答社区的17,387条医疗问题,这些问题被归类为20个不同的类别。数据集按照训练集(60%)、验证集(20%)和测试集(20%)的比例进行划分,采用随机分区的形式。规模上,该数据集覆盖了20个类别的17,387条问题,任务是对这些问题进行分类。

This dataset includes 17,387 medical questions sourced from the 120ask Q&A community, with all questions categorized into 20 distinct categories. It is randomly partitioned into three subsets: 60% for training, 20% for validation, and 20% for testing. Covering 17,387 questions across 20 categories, the task of this dataset is to classify these medical questions.
提供机构:
120ask
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MedQuAD是一个包含47,457个医学问答对的数据集,来源于12个NIH网站,涵盖多种医学问题类型,并附带丰富注释。数据集还包括一个测试集,用于评估问答系统的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作