SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models

Name: SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models
Creator: SeanWu25
Published: 2023-11-16 02:31:27
License: 暂无描述

Hugging Face2023-11-16 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是为论文《开源大语言模型、GPT-4和Claude 2的比较研究：肾病学中的多项选择测试》而创建的。数据集包含两个主要文件：一个是包含所有问题及其对应答案的CSV文件，另一个是提供与这些问题相关的真实解释的CSV文件。这些数据可用于研究或实验，以探索在肾病学领域中的多项选择测试问题。

This dataset is prepared for the paper A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology, containing two files: NEJM_All_Questions_And_Answers.csv includes all questions and answers, and Ground_Truth_Answers.csv provides ground truth explanations for the questions. The dataset is used to study the performance of open-source large language models in multiple-choice tests in nephrology.

提供机构：

SeanWu25

原始信息汇总

数据集概述

数据集简介

本数据集是为论文《A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology》准备的。该论文的预印本可在此处访问。

文件

本仓库包含两个关键文件：

NEJM_All_Questions_And_Answers.csv: 该文件包含研究中使用的所有问题及其对应答案。
Ground_Truth_Answers.csv: 该文件提供与主数据集中问题相关的真实解释。

使用方法

要使用此数据集进行研究或实验：

下载: 从本仓库获取数据集文件。
加载: 将数据集导入您首选的数据分析或机器学习环境。
探索: 根据您的具体用例调查问题、答案和真实解释。

5,000+

优质数据集

54 个

任务类型

进入经典数据集