steelman-sft-ada
收藏Hugging Face2026-03-13 更新2026-04-23 收录
下载链接:
https://huggingface.co/datasets/the-clanker-lover/steelman-sft-ada
下载链接
链接失效反馈官方服务:
资源简介:
Steelman SFT 是首个公开的用于 Ada 2022 和 SPARK 代码生成的指令调优数据集,包含 3,430 个经过编译器验证的指令-输出对。每个示例都能通过 GNAT Ada 编译器无错误编译。数据集包含多种任务类型:标准生成(3,235 个)、规范到实现(100 个)、错误修复(50 个)和多文件生成(45 个)。所有标准生成指令经过重写以避免重复模式,使用 12 种以上不同的动词模式和 15-20% 的非命令式指令风格。数据采用 Alpaca 格式,每个 JSON 对象包含 instruction、input 和 output 字段。所有输出都经过 gnatmake 编译验证,确保 100% 编译通过率,并进行了去重和指令-输出对齐验证。数据集适用于文本生成任务,特别是安全关键系统的代码生成场景。需要注意的是,所有示例均为合成生成,仅通过编译器验证,未经过人工全面审查,且不保证 SPARK 证明的完整性。
创建时间:
2026-03-12



