Ascend-COT-v2-json
收藏AscendKernelGen/Ascend-COT-v2-json 数据集详情
数据集概述
- 数据集名称:AscendKernelGen/Ascend-COT-v2-json
- 语言:英语(en)、中文(zh)
- 许可证:Apache-2.0
- 任务类型:文本生成(text-generation)
- 标签:代码生成(code-generation)、NPU、思维链(CoT)、昇腾(ascend)
数据集内容
该数据集是完整 Ascend-CoT 数据集的一个子集,完整数据集将分阶段发布。Ascend-CoT 数据集是一个高质量、领域特定的数据集,融合了从真实内核实现中提取的思维链(Chain-of-Thought, CoT)推理。它包含三种推理类型:
- 基于文档的推理
- 从实际NPU内核代码中提取的以代码为中心的推理
- 通用推理链:捕捉华为昇腾硬件上低级NPU编程所需的结构化逻辑和严格约束
相关资源
- 论文:AscendKernelGen: A Systematic Study of LLM-Based Kernel Generation for Neural Processing Units
- 代码仓库:NPUKernelBench GitHub Repository
背景框架:AscendKernelGen (AKGen)
该数据集作为 AscendKernelGen (AKGen) 框架的一部分,通过数据构建、训练和评估的闭环系统,弥合通用代码生成与硬件特定编程之间的差距。核心创新包括:
- Ascend-CoT 数据集:如上所述,融合CoT推理的高质量领域特定数据集
- 领域自适应后训练:两阶段优化过程,产出 KernelGen-LM。首先采用基于错误推导监督的监督微调(SFT),随后使用基于执行正确性和性能信号的直接偏好优化(DPO)进行强化学习(RL)
- 硬件接地评估:使用 NPUKernelBench 基准,在实际昇腾硬件上评估编译成功率、功能正确性和性能(延迟)
引用
bibtex @article{cao2026ascendkernelgen, title={AscendKernelGen: A Systematic Study of LLM-Based Kernel Generation for Neural Processing Units}, author={Xinzi Cao and Jianyang Zhai and Pengfei Li and Zhiheng Hu and Cen Yan and Bingxu Mu and Guanghuan Fang and Bin She and Jiayu Li and Yihan Su and Dongyang Tao and Xiansong Huang and Fan Xu and Feidiao Yang and Yao Lu and Chang-Dong Wang and Yutong Lu and Weicheng Xue and Bin Zhou and Yonghong Tian}, journal={arXiv preprint arXiv:2601.07160}, year={2026}, url={https://arxiv.org/abs/2601.07160} }




