分布式训练框架功能测试数据
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=686a8dc3195d2621a90dbfbc&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据来源于人工智能集群环境下对大规模分布式训练框架的功能进行的功能验证测试,主要是获得分布式训练框架支持分布式自动并行训练的测试数据,
采集:通过在PyTorch环境下,读取LLAMA2模型结构、OpenWebText公开数据集等相关配置,查看分布式训练框架版本,确认为本项目研发的分布式训练框架,运行测试脚本,调用模型代码,对人工智能加速卡自动进行分布式并行训练数据进行采集。
加工:测试数据由实际软硬件环境计算形成,经过人工格式整理,不存在人为编辑和处理的情况;通过规范化的数据采集方式,确保数据的采集过程严格遵循科学方法论,相应的测试方案经过技术专家进行论证,确保数据生成方法可复现且科学合理。
处理方式:所有数据均采用统一的格式规范进行整理,确保数据结构清晰、易于理解和使用,为后续研究提供标准化的数据支撑。同时,通过完整的数据质量控制流程,确保数据的真实性、完整性和一致性,减少人为误差,提高数据的可靠性和准确性,为相关研究和分析提供高质量的数据基础。
提供机构:
中科寒武纪科技股份有限公司



