five

baber/agieval|认知评估数据集|问题解决数据集

收藏
hugging_face2023-10-26 更新2024-03-04 收录
认知评估
问题解决
下载链接:
https://hf-mirror.com/datasets/baber/agieval
下载链接
链接失效反馈
资源简介:
AGIEval是一个以人为中心的基准测试,专门设计用于评估基础模型在人类认知和问题解决相关任务中的一般能力。该基准测试来源于20个官方、公开和高标准的入学和资格考试,这些考试面向普通人类考生,如大学入学考试(如中国高考和美国SAT)、法学院入学考试、数学竞赛、律师资格考试和国家公务员考试。
提供机构:
baber
原始信息汇总

数据集概述

数据集名称

AGIEval

数据集描述

AGIEval是一个以人为中心的基准,专门设计来评估基础模型在与人认知和问题解决相关的任务中的通用能力。该基准源自20个官方、公开、高标准的人类考试,包括大学入学考试(如中国高考和美国SAT)、法学院入学考试、数学竞赛、律师资格考试和国家公务员考试。

数据集用途

用于评估基础模型在人类认知和问题解决任务中的表现。

数据集类别

  • 问题回答
  • 文本生成

许可证

MIT

语言

英语

引用信息

@misc{zhong2023agieval, title={AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models}, author={Wanjun Zhong and Ruixiang Cui and Yiduo Guo and Yaobo Liang and Shuai Lu and Yanlin Wang and Amin Saied and Weizhu Chen and Nan Duan}, year={2023}, eprint={2304.06364}, archivePrefix={arXiv}, primaryClass={cs.CL} }

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录