SPoC (Pseudocode-to-Code)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SPoC
下载链接
链接失效反馈官方服务:
资源简介:
我们考虑将伪代码映射到功能正确的长程序的任务。给定测试用例作为验证程序的机制,我们搜索伪代码的可能翻译空间以找到通过验证的程序。然而,如果没有适当的信用分配来定位程序失败的根源,就很难将搜索引导到更有希望的程序上。我们建议根据编译错误的信号执行信用分配,编译错误占程序失败的 88.7%。具体来说,我们将每个伪代码行的翻译视为程序的一个离散部分,并且每当合成程序编译失败时,错误定位方法会尝试识别导致失败的程序部分。然后,我们将搜索重点放在这些部分的伪代码的替代翻译上。为了评估,我们收集了 SPoC 数据集(基于搜索的伪代码到代码),其中包含 18,356 个程序,其中包含人工编写的伪代码和测试用例。在 100 个程序编译的预算下,与使用伪代码的 top-one 翻译相比,执行搜索将合成成功率从 25.6% 提高到 44.7%。
提供机构:
OpenDataLab
创建时间:
2022-05-09



