five

xw27/scibench

收藏
Hugging Face2024-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xw27/scibench
下载链接
链接失效反馈
官方服务:
资源简介:
SciBench是一个用于评估大型语言模型(LLMs)在解决大学水平科学问题方面的复杂推理能力、强大领域知识和高级计算技能的新基准。数据集来源于教学教科书,旨在评估LLMs在科学问题解决方面的能力。
提供机构:
xw27
原始信息汇总

SciBench 数据集概述

数据集目的

SciBench 是一个专为评估大型语言模型(LLMs)在大学水平科学问题上的复杂推理能力、领域知识和高级计算技能而设计的新型基准。

数据来源

数据集中的问题来源于大学水平的教科书。

引用信息

若使用此数据集,请引用以下文献:

@inproceedings{wang2024scibench, author = {Wang, Xiaoxuan and Hu, Ziniu and Lu, Pan and Zhu, Yanqiao and Zhang, Jieyu and Subramaniam, Satyen and Loomba, Arjun R. and Zhang, Shichang and Sun, Yizhou and Wang, Wei}, title = {{SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models}}, booktitle = {Proceedings of the Forty-First International Conference on Machine Learning}, year = {2024}, }

许可证

数据集遵循 MIT 许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作