AngoHF/ANGO-S1
收藏Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AngoHF/ANGO-S1
下载链接
链接失效反馈官方服务:
资源简介:
ANGO是一个新颖的面向生成的中文LLM评估基准。它首次引入了单问题多关键点的数据集格式,包含171个关键点,分布在4个层次和9个难度类别中。数据来源于中国公务员考试中的行政职业能力测验。将采用季节性系统更新排行榜,每两个月更新一次,并在每个季节开始时公布相应的测试数据集,部分问题将在季节结束时被淘汰。
ANGO is a novel generative-oriented Chinese Large Language Model (LLM) evaluation benchmark. It pioneers the single-question multi-key-point dataset format, which includes 171 key points distributed across 4 hierarchical levels and 9 difficulty categories. The dataset is sourced from the Administrative Aptitude Test (AAT) of China's civil service examination. A seasonal systematic leaderboard update mechanism will be adopted, with updates conducted every two months. The corresponding test datasets will be released at the start of each season, and a portion of the questions will be phased out at the end of each season.
提供机构:
AngoHF
原始信息汇总
数据集概述
数据集名称
- ANGO
数据集描述
- ANGO 是一个面向生成的中文大型语言模型评估基准。
- 首次引入单问题多关键点的数据集格式,包含171个关键点,分布在4个层次级别和9个难度类别中。
数据来源
- 数据来源于中国公务员考试中的行政职业能力测试。
数据集任务类别
- 问答
- 文本到文本生成
- 文本生成
语言
- 中文
数据集大小
- 1K<n<10K
更新周期
- 排行榜每两个月更新一次,每个赛季开始时公布相应的测试数据集,赛季结束时淘汰部分问题。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



