MedExQA|医学问答数据集|语言模型评估数据集

arXiv2024-06-10 更新2024-08-06 收录

医学问答

语言模型评估

下载链接：

http://arxiv.org/abs/2406.06331v1

下载链接

链接失效反馈

资源简介：

MedExQA是一个专为医学问答设计的创新基准数据集，由伦敦大学学院健康信息学研究所创建。该数据集涵盖了五个在现有数据集中代表性不足的医学专业领域，包括生物医学工程、临床实验室科学、临床心理学、职业治疗和言语语言病理学。数据集包含965个问题，每个问题答案对附有两套解释，旨在评估大型语言模型在医学知识理解方面的解释能力。创建过程中，数据从多种在线资源手动收集，并经过严格的预处理和人工验证，确保数据的质量和多样性。MedExQA的应用领域主要集中在提高医学领域语言模型的解释性和准确性，特别是在临床决策支持和医学知识检索方面。

提供机构：

伦敦大学学院健康信息学研究所

创建时间：

2024-06-10

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

PROSLU

PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的，包含超过5000条中文语句，每条语句都配有详细的个人资料信息，如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量，旨在解决在语义模糊的实际场景中，传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力，特别是在用户意图不明确或语句具有多重含义的情况下。

arXiv 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建，包含5686张图像和45578个标签，重点关注六种行为：举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景，通过YOLOv5、YOLOv7和YOLOv8算法评估，平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础，解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey（CHNS）是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目，旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响，以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体，采用多阶段随机抽样方法，收集了家庭、个体以及社区层面的详细数据，包括饮食、健康、经济和社会因素等信息。自2011年起，CHNS不断扩展，新增多个城市和省份，并持续完善纵向数据链接，为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集，包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素，标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录