ORAN-Bench-13K
收藏ORAN-Bench-13K: 评估大型语言模型在开放无线接入网络中的性能的开源基准
简介
ORAN-Bench-13K 是首个全面评估大型语言模型(LLMs)在开放无线接入网络(O-RAN)环境中性能的基准。该基准包含从116份O-RAN规范文档中精心挑选的13,952个多选题。它旨在评估LLMs在理解和生成特定于O-RAN任务的人类般文本方面的熟练程度。
动机
O-RAN技术的快速发展需要开发能够管理这些网络中复杂任务的复杂和智能系统。大型语言模型在各个领域显示出显著潜力,但尚未在O-RAN的特定环境中得到充分评估。ORAN-Bench-13K通过提供一个强大且全面的基准来填补这一空白,以评估LLMs在此关键领域的能力。
仓库结构
- MCQA: 该文件夹包含三个JSON文件(Fin_E.json, Fin_M.json, Fin_D.json),对应不同难度的多选题。
使用方法
要使用该基准,您可以加载Benchmark文件夹中的JSON文件,并将其集成到您的LLM评估框架中。每个文件包含一系列问题、选项和正确答案索引。
引用
如果您在研究中使用ORAN-Bench-13K,请按以下方式引用我们的工作:
bibtex @misc{gajjar2024oranbench13kopensourcebenchmark, title={ORAN-Bench-13K: An Open Source Benchmark for Assessing LLMs in Open Radio Access Networks}, author={Pranshav Gajjar and Vijay K. Shah}, year={2024}, eprint={2407.06245}, archivePrefix={arXiv}, primaryClass={cs.NI}, url={https://arxiv.org/abs/2407.06245}, }
贡献
我们欢迎对基准的扩展和改进做出贡献。如果您有建议或想添加新问题,请与我们联系。
许可证
本项目基于MIT许可证。更多详情请参见LICENSE文件。

- 1ORAN-Bench-13K: An Open Source Benchmark for Assessing LLMs in Open Radio Access Networks乔治梅森大学NextG无线实验室 · 2024年



