five

SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models

收藏
Hugging Face2023-11-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SeanWu25/NEJM-AI_Benchmarking_Medical_Language_Models
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为论文《开源大语言模型、GPT-4和Claude 2的比较研究:肾病学中的多项选择测试》而创建的。数据集包含两个主要文件:一个是包含所有问题及其对应答案的CSV文件,另一个是提供与这些问题相关的真实解释的CSV文件。这些数据可用于研究或实验,以探索在肾病学领域中的多项选择测试问题。

This dataset is prepared for the paper A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology, containing two files: NEJM_All_Questions_And_Answers.csv includes all questions and answers, and Ground_Truth_Answers.csv provides ground truth explanations for the questions. The dataset is used to study the performance of open-source large language models in multiple-choice tests in nephrology.
提供机构:
SeanWu25
原始信息汇总

数据集概述

数据集简介

本数据集是为论文《A Comparative Study of Open-Source Large Language Models, GPT-4 and Claude 2: Multiple-Choice Test Taking in Nephrology》准备的。该论文的预印本可在此处访问。

文件

本仓库包含两个关键文件:

  1. NEJM_All_Questions_And_Answers.csv: 该文件包含研究中使用的所有问题及其对应答案。

  2. Ground_Truth_Answers.csv: 该文件提供与主数据集中问题相关的真实解释。

使用方法

要使用此数据集进行研究或实验:

  1. 下载: 从本仓库获取数据集文件。
  2. 加载: 将数据集导入您首选的数据分析或机器学习环境。
  3. 探索: 根据您的具体用例调查问题、答案和真实解释。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作