SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models
收藏Hugging Face2023-11-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为论文《开源大语言模型、GPT-4和Claude 2的比较研究:肾病学中的多项选择测试》而创建的。数据集包含两个主要文件:一个是包含所有问题及其对应答案的CSV文件,另一个是提供与这些问题相关的真实解释的CSV文件。这些数据可用于研究或实验,以探索在肾病学领域中的多项选择测试问题。
This dataset is prepared for the paper A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology, containing two files: NEJM_All_Questions_And_Answers.csv includes all questions and answers, and Ground_Truth_Answers.csv provides ground truth explanations for the questions. The dataset is used to study the performance of open-source large language models in multiple-choice tests in nephrology.
提供机构:
SeanWu25
原始信息汇总
数据集概述
数据集简介
本数据集是为论文《A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology》准备的。该论文的预印本可在此处访问。
文件
本仓库包含两个关键文件:
-
NEJM_All_Questions_And_Answers.csv: 该文件包含研究中使用的所有问题及其对应答案。
-
Ground_Truth_Answers.csv: 该文件提供与主数据集中问题相关的真实解释。
使用方法
要使用此数据集进行研究或实验:
- 下载: 从本仓库获取数据集文件。
- 加载: 将数据集导入您首选的数据分析或机器学习环境。
- 探索: 根据您的具体用例调查问题、答案和真实解释。



