five

巴西国家中学考试(ENEM)问题数据集

收藏
arXiv2023-09-21 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2309.12071v1
下载链接
链接失效反馈
官方服务:
资源简介:
巴西国家中学考试(ENEM)问题数据集是由联邦大学坎皮纳斯格兰德计算机与系统系的Matheus L. O. Santos和Cl´audio E. C. Campelo创建,包含1006个问题,覆盖2010至2022年的考试题目。该数据集主要由文本描述、问题和五个选项组成,专注于文本理解能力。数据集的创建过程涉及从PDF格式中提取文本,并使用特定的筛选标准去除不适合的问题。该数据集主要用于评估大型语言模型在解决实际考试问题上的能力,特别是在自然语言处理领域的应用。

The question dataset for the Brazilian National High School Exam (ENEM) was created by Matheus L. O. Santos and Cláudio E. C. Campelo from the Department of Computer and Systems, Federal University of Campina Grande. It contains 1006 questions spanning the exams held between 2010 and 2022. This dataset primarily consists of textual descriptions, questions, and five multiple-choice options, focusing on textual comprehension abilities. The construction of this dataset involved extracting text from PDF files and removing unsuitable questions using specific screening criteria. It is mainly used to evaluate the capabilities of large language models (LLMs) in solving real-world exam problems, particularly for applications in the field of natural language processing.
提供机构:
联邦大学坎皮纳斯格兰德计算机与系统系
创建时间:
2023-09-21
二维码
社区交流群
二维码
科研交流群
商业服务