ardneebwar/medmcqa-and-race
收藏Hugging Face2024-03-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ardneebwar/medmcqa-and-race
下载链接
链接失效反馈官方服务:
资源简介:
MEDMCQA-and-RACE数据集是由MedMCQA和RACE两个知名数据集精炼组合而成,专门用于开发和评估机器学习模型在多项选择题(MCQ)生成方面的能力。原始数据包含超过200,000条记录,经过精心清理和压缩,最终保留了约6,000条高质量的数据。每条数据包括一个上下文(文本内容)、一个对应的问题、一组多项选择答案和正确答案。这种结构使得该数据集成为训练和测试基于给定上下文生成MCQ及其答案的NLP模型的理想资源。
MEDMCQA-and-RACE数据集是由MedMCQA和RACE两个知名数据集精炼组合而成,专门用于开发和评估机器学习模型在多项选择题(MCQ)生成方面的能力。原始数据包含超过200,000条记录,经过精心清理和压缩,最终保留了约6,000条高质量的数据。每条数据包括一个上下文(文本内容)、一个对应的问题、一组多项选择答案和正确答案。这种结构使得该数据集成为训练和测试基于给定上下文生成MCQ及其答案的NLP模型的理想资源。
提供机构:
ardneebwar
原始信息汇总
数据集: MEDMCQA-and-RACE
该数据集是两个知名数据集MedMCQA和RACE的精炼组合,专门用于开发和评估机器学习模型在多选题(MCQ)生成方面的应用。原始数据集包含超过200,000条记录,经过精心清洗和浓缩,现包含约6,000条高质量数据。
内容结构
- context: 包含基于其生成问题和多选答案的文本内容或段落。
- question: 从上下文中创建的问题。
- options: 包含与问题相关的四个多选答案(A, B, C, D)。
- correct_answer: 指示提供的选项中的正确答案。
应用场景
该数据集适用于多种应用,包括但不限于:
- 训练模型从文本内容生成多选题。
- 评估NLP模型的理解和信息检索能力。
- 协助教育工作者和内容创作者生成教育材料和评估问题。



