OpenLLM Benchmark
收藏DataCite Commons2025-01-03 更新2025-04-16 收录
下载链接:
https://service.tib.eu/ldmservice/dataset/b340776a-4021-4554-b4d4-ad0bdb50b0ed
下载链接
链接失效反馈官方服务:
资源简介:
The dataset used in the paper is the OpenLLM benchmark, which includes datasets such as ARC, HellaSwag, TruthfulQA, and MMLU.
本论文所采用的数据集为开源大语言模型基准测试集(OpenLLM benchmark),该基准测试集涵盖ARC、HellaSwag、TruthfulQA以及MMLU等数据集。
提供机构:
TIB
创建时间:
2025-01-03



