five

ardneebwar/medmcqa-and-race

收藏
Hugging Face2024-03-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ardneebwar/medmcqa-and-race
下载链接
链接失效反馈
官方服务:
资源简介:
MEDMCQA-and-RACE数据集是由MedMCQA和RACE两个知名数据集精炼组合而成,专门用于开发和评估机器学习模型在多项选择题(MCQ)生成方面的能力。原始数据包含超过200,000条记录,经过精心清理和压缩,最终保留了约6,000条高质量的数据。每条数据包括一个上下文(文本内容)、一个对应的问题、一组多项选择答案和正确答案。这种结构使得该数据集成为训练和测试基于给定上下文生成MCQ及其答案的NLP模型的理想资源。

MEDMCQA-and-RACE数据集是由MedMCQA和RACE两个知名数据集精炼组合而成,专门用于开发和评估机器学习模型在多项选择题(MCQ)生成方面的能力。原始数据包含超过200,000条记录,经过精心清理和压缩,最终保留了约6,000条高质量的数据。每条数据包括一个上下文(文本内容)、一个对应的问题、一组多项选择答案和正确答案。这种结构使得该数据集成为训练和测试基于给定上下文生成MCQ及其答案的NLP模型的理想资源。
提供机构:
ardneebwar
原始信息汇总

数据集: MEDMCQA-and-RACE

该数据集是两个知名数据集MedMCQA和RACE的精炼组合,专门用于开发和评估机器学习模型在多选题(MCQ)生成方面的应用。原始数据集包含超过200,000条记录,经过精心清洗和浓缩,现包含约6,000条高质量数据。

内容结构

  • context: 包含基于其生成问题和多选答案的文本内容或段落。
  • question: 从上下文中创建的问题。
  • options: 包含与问题相关的四个多选答案(A, B, C, D)。
  • correct_answer: 指示提供的选项中的正确答案。

应用场景

该数据集适用于多种应用,包括但不限于:

  • 训练模型从文本内容生成多选题。
  • 评估NLP模型的理解和信息检索能力。
  • 协助教育工作者和内容创作者生成教育材料和评估问题。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作