MedCalc-Bench 医疗计算数据集

超神经2024-11-14 更新2024-12-14 收录

下载链接：

https://hyper.ai/cn/datasets/35145

下载链接

链接失效反馈

官方服务：

资源简介：

MedCalc-Bench 是一个专门用于评估大语言模型 (LLMs) 在医疗计算能力方面的数据集，由美国国立卫生研究院国家医学图书馆 (National Library of Medicine, National Institutes of Health) 和弗吉尼亚大学 (University of Virginia) 等 9 个机构于 2024 年共同发布，相关论文成果为「MEDCALC-BENCH: Evaluating Large Language Models for Medical Calculations」，已被 NeurIPS 2024 接受。

MedCalc-Bench 是一款专为评估大语言模型（Large Language Models，LLMs）医疗计算能力而打造的数据集，由美国国立卫生研究院国家医学图书馆（National Library of Medicine, National Institutes of Health）、弗吉尼亚大学（University of Virginia）等9家机构于2024年联合发布。该数据集对应的研究论文题为《MEDCALC-BENCH: Evaluating Large Language Models for Medical Calculations》，目前已被NeurIPS 2024接收。

创建时间：

2024-10-22

搜集汇总

数据集介绍

背景与挑战

背景概述

MedCalc-Bench是一个由美国国立卫生研究院国家医学图书馆和弗吉尼亚大学等机构于2024年发布的医疗计算数据集，专门用于评估大语言模型在医疗计算任务中的能力。该数据集包含超过1.1万个训练和测试实例，涵盖55种计算任务，每个实例提供患者笔记、问题、答案和逐步解决方案，旨在提升模型在医疗环境中的语言和计算推理表现。

以上内容由遇见数据集搜集并总结生成