five

大模型高效连续微调算法测试数据

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683de9e7195d261233189770&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
所用的数据均来自持续学习公开基准TRACE(地址:https://github.com/BeyonderXX/TRACE),该基准遵循三个原则构建:数据新颖性、对大语言模型的挑战性以及任务多样性。数据集涵盖了多个领域和任务,旨在评估模型在持续学习环境中的表现。其中,领域特定任务数据集包括ScienceQA、FOMC和MeetingBank,这些任务要求模型具备特定领域的知识和推理能力;多语言任务数据集包含C-STANCE和20Minuten,用于评估模型的跨语言处理能力;代码补全任务数据集包含CodeXGLUE,要求模型根据长代码输入生成下一行代码;数学推理任务数据集包含NumGLUE,重点评估模型的算术推理能力。上述所有数据集均已标准化为统一格式,每条数据分为两部分,一是输入数据,包括任务描述与具体问题;二是标准答案,包括可供参考的推理过程与最终回答。
提供机构:
华为技术有限公司
二维码
社区交流群
二维码
科研交流群
商业服务