xw27/scibench

Name: xw27/scibench
Creator: xw27
Published: 2024-05-06 09:17:02
License: 暂无描述

Hugging Face2024-05-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/xw27/scibench

下载链接

链接失效反馈

官方服务：

资源简介：

SciBench是一个用于评估大型语言模型（LLMs）在解决大学水平科学问题方面的复杂推理能力、强大领域知识和高级计算技能的新基准。数据集来源于教学教科书，旨在评估LLMs在科学问题解决方面的能力。

提供机构：

xw27

原始信息汇总

SciBench 数据集概述

数据集目的

SciBench 是一个专为评估大型语言模型（LLMs）在大学水平科学问题上的复杂推理能力、领域知识和高级计算技能而设计的新型基准。

数据来源

数据集中的问题来源于大学水平的教科书。

引用信息

若使用此数据集，请引用以下文献：

@inproceedings{wang2024scibench, author = {Wang, Xiaoxuan and Hu, Ziniu and Lu, Pan and Zhu, Yanqiao and Zhang, Jieyu and Subramaniam, Satyen and Loomba, Arjun R. and Zhang, Shichang and Sun, Yizhou and Wang, Wei}, title = {{SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models}}, booktitle = {Proceedings of the Forty-First International Conference on Machine Learning}, year = {2024}, }

许可证

数据集遵循 MIT 许可证。

5,000+

优质数据集

54 个

任务类型

进入经典数据集