大模型高效连续微调算法测试数据

Name: 大模型高效连续微调算法测试数据
Creator: 华为技术有限公司
Published: 2026-01-30T15:43:41+08:00

国家基础学科公共科学数据中心2026-01-30 收录

持续学习

模型微调

数据链接：

https://nbsdc.cn/general/dataDetail?id=683de9e7195d261233189770&type=1 数据链接链接失效反馈

官方服务：

资源简介：

所用的数据均来自持续学习公开基准TRACE(地址：https://github.com/BeyonderXX/TRACE)，该基准遵循三个原则构建：数据新颖性、对大语言模型的挑战性以及任务多样性。数据集涵盖了多个领域和任务，旨在评估模型在持续学习环境中的表现。其中，领域特定任务数据集包括ScienceQA、FOMC和MeetingBank，这些任务要求模型具备特定领域的知识和推理能力；多语言任务数据集包含C-STANCE和20Minuten，用于评估模型的跨语言处理能力；代码补全任务数据集包含CodeXGLUE，要求模型根据长代码输入生成下一行代码；数学推理任务数据集包含NumGLUE，重点评估模型的算术推理能力。上述所有数据集均已标准化为统一格式，每条数据分为两部分，一是输入数据，包括任务描述与具体问题；二是标准答案，包括可供参考的推理过程与最终回答。

提供机构：

华为技术有限公司

搜集汇总

数据集介绍