five

AGIEval

收藏
魔搭社区2025-11-13 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/AGIEval
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: AGIEval license: - MIT taskTypes: [] mediaTypes: - Text labelTypes: [] tags: - attrs: null id: 11864 name: en: '' zh: 文本检索 publisher: - Microsoft publishDate: '2023-04-01' publishUrl: https://huggingface.co/datasets/lighteval/agi_eval_en paperUrl: https://arxiv.org/pdf/2304.06364.pdf --- # 数据集介绍 ## 简介 AGIEval is a human-centric benchmark specifically designed to evaluate the general abilities of foundation models in tasks pertinent to human cognition and problem-solving. This benchmark is derived from 20 official, public, and high-standard admission and qualification exams intended for general human test-takers, such as general college admission tests (e.g., Chinese College Entrance Exam (Gaokao) and American SAT), law school admission tests, math competitions, lawyer qualification tests, and national civil service exams. For a full description of the benchmark ## 引文 ``` @misc{zhong2023agieval, title={AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models}, author={Wanjun Zhong and Ruixiang Cui and Yiduo Guo and Yaobo Liang and Shuai Lu and Yanlin Wang and Amin Saied and Weizhu Chen and Nan Duan}, year={2023}, eprint={2304.06364}, archivePrefix={arXiv}, primaryClass={cs.CL} ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: AGIEval 许可证: - MIT许可证 任务类型: 无 媒体类型: - 文本(Text) 标签类型: 无 标签: - 属性: 空 ID: 11864 英文名称: '' 中文名称: 文本检索 发布方: - 微软(Microsoft) 发布日期: 2023年4月1日 发布地址: https://huggingface.co/datasets/lighteval/agi_eval_en 论文地址: https://arxiv.org/pdf/2304.06364.pdf --- # 数据集介绍 ## 简介 AGIEval是一款以人为中心的基准评测集,专为评估基础模型在人类认知与问题求解相关任务中的通用能力而设计。该评测集源自20项面向普通人类考生的官方、公开且高标准的入学与资格考试,例如普通高等学校招生全国统一考试(中国高考(Gaokao))、美国学术能力评估测试(SAT)、法学院入学考试、数学竞赛、律师资格考试以及国家公务员考试等。如需了解该评测集的完整说明 ## 引用格式 @misc{zhong2023agieval, title={AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models}, author={Wanjun Zhong and Ruixiang Cui and Yiduo Guo and Yaobo Liang and Shuai Lu and Yanlin Wang and Amin Saied and Weizhu Chen and Nan Duan}, year={2023}, eprint={2304.06364}, archivePrefix={arXiv}, primaryClass={cs.CL} } ## 下载数据集 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-06-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AGIEval是一个以人为中心的基准测试数据集,专门用于评估基础模型在人类认知和问题解决任务中的通用能力。该数据集基于20个官方、公开、高标准的入学和资格考试(如中国高考、美国SAT等),旨在模拟人类应试者的真实场景,适用于文本检索和相关研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作