livebench/data_analysis

Name: livebench/data_analysis
Creator: livebench
Published: 2025-04-07 20:34:15
License: 暂无描述

Hugging Face2025-04-07 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/livebench/data_analysis

下载链接

链接失效反馈

官方服务：

资源简介：

LiveBench是一个专为限制测试集污染和客观评估而设计的大型语言模型（LLM）基准测试。它具有以下特点：每月发布新问题，问题基于最新发布的数据集、arXiv论文、新闻文章和IMDb电影摘要；每个问题都有可验证的客观真实答案，允许准确自动评分，无需使用LLM评判；目前包含18个多样化的任务，跨越6个类别，并计划发布更困难的任务。这是LiveBench的instruction_following类别。

提供机构：

livebench

原始信息汇总

数据集概述

数据集特征

question_id: 数据类型 - 字符串
category: 数据类型 - 字符串
turns: 数据类型 - 字符串序列
ground_truth: 数据类型 - 字符串
grouping: 数据类型 - 字符串

数据集分割

测试集 (test):
- 数据大小: 305448 字节
- 示例数量: 150

数据集大小

下载大小: 148804 字节
数据集总大小: 305448 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集