UGPhysics
收藏UGPhysics 数据集
数据集简介
UGPhysics 是一个大规模、全面的基准数据集,专为评估大型语言模型(LLM)在多个大学本科生级别物理学(UGPhysics)学科中的问题解决能力而设计。该数据集包含 5,520 个独特的问题,分为三个主要领域、13 个核心科目和 59 个关键主题。
数据集构成
- 问题数量:5,520 个
- 领域:3 个主要领域
- 科目:13 个核心科目
- 主题:59 个关键主题
使用说明
数据下载
bash git clone https://huggingface.co/datasets/UGPhysics/ugphysics mv ugphysics/* ./data/
模型测试
关闭源模型
bash python codes/infer_close.py --model ${MODEL} --subject ${SUBJECT}
开放源模型
bash python codes/generate_open.py --model ${MODEL} --system ${SYS_PROMPT} --subject ${SUBJECT} --tensor_parallel_size 8
评估
bash python codes/eval.py --model_path ${MODEL} --subject ${SUBJECT}
引用信息
plaintext @misc{xu2025ugphysics, title={UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models}, author={Xin Xu and Qiyun Xu and Tong Xiao and Tianhao Chen and Yuchen Yan and Jiaxin Zhang and Shizhe Diao and Can Yang and Yang Wang}, year={2025}, eprint={2502.00334}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2502.00334}, }




