five

AngoHF/ANGO-S1

收藏
Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AngoHF/ANGO-S1
下载链接
链接失效反馈
官方服务:
资源简介:
ANGO是一个新颖的面向生成的中文LLM评估基准。它首次引入了单问题多关键点的数据集格式,包含171个关键点,分布在4个层次和9个难度类别中。数据来源于中国公务员考试中的行政职业能力测验。将采用季节性系统更新排行榜,每两个月更新一次,并在每个季节开始时公布相应的测试数据集,部分问题将在季节结束时被淘汰。

ANGO is a novel generative-oriented Chinese Large Language Model (LLM) evaluation benchmark. It pioneers the single-question multi-key-point dataset format, which includes 171 key points distributed across 4 hierarchical levels and 9 difficulty categories. The dataset is sourced from the Administrative Aptitude Test (AAT) of China's civil service examination. A seasonal systematic leaderboard update mechanism will be adopted, with updates conducted every two months. The corresponding test datasets will be released at the start of each season, and a portion of the questions will be phased out at the end of each season.
提供机构:
AngoHF
原始信息汇总

数据集概述

数据集名称

  • ANGO

数据集描述

  • ANGO 是一个面向生成的中文大型语言模型评估基准。
  • 首次引入单问题多关键点的数据集格式,包含171个关键点,分布在4个层次级别和9个难度类别中。

数据来源

  • 数据来源于中国公务员考试中的行政职业能力测试。

数据集任务类别

  • 问答
  • 文本到文本生成
  • 文本生成

语言

  • 中文

数据集大小

  • 1K<n<10K

更新周期

  • 排行榜每两个月更新一次,每个赛季开始时公布相应的测试数据集,赛季结束时淘汰部分问题。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作