Verus_Training_Data

Name: Verus_Training_Data
Creator: Microsoft
Published: 2026-02-06 17:49:47
License: 暂无描述

Hugging Face2026-02-06 更新2026-02-07 收录

下载链接：

https://huggingface.co/datasets/microsoft/Verus_Training_Data

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集为Verus训练数据，用于SAFE和VeruSyn项目。数据集包含两部分：SAFE的SFT数据和VeruSyn的原始轨迹数据。SAFE的SFT数据分为两个文件：`sft_safe_25k.json`包含25K样本（11K证明生成和14K调试），`sft_part1_6.9M.json`包含6.9M样本（5.7M证明生成和1.2M调试），`sft_part2_4557.json`包含4.6K长链思维样本（1.4K证明生成和3.2K调试）。VeruSyn的原始轨迹数据包括`algorithmic_trajectory_9040.jsonl`（成功7396，错误271，超时1373）和`system_trajectory_843.jsonl`（成功609，错误96，超时138）。该数据集适用于证明生成、调试和算法轨迹分析等任务。

提供机构：

Microsoft

创建时间：

2026-02-06

搜集汇总

数据集介绍

构建方式

在形式化验证与程序合成领域，Verus_Training_Data的构建体现了数据驱动的严谨方法。该数据集通过系统化采集与标注流程生成，核心部分包含监督微调（SFT）数据与原始轨迹记录。SFT数据进一步细分为针对证明生成与调试任务的大规模样本集合，其中证明生成样本占据主体，辅以精心构建的长链思维（CoT）样本以增强推理深度。原始轨迹部分则完整保留了算法与系统层面的执行路径，并标注了成功、错误及超时等状态，为模型训练提供了丰富的结构化反馈信号。

使用方法

对于致力于形式化验证或程序合成的研究者而言，该数据集提供了清晰的应用路径。监督微调数据可直接用于训练或微调大型语言模型，以提升其在代码证明生成与程序调试方面的专业能力。研究人员可依据任务目标，灵活选用不同规模与类型的SFT子集进行实验。原始轨迹数据则为强化学习训练、失败案例分析与模型评估提供了宝贵的环境。建议使用者结合具体研究问题，对数据进行有针对性的预处理与任务适配，以充分发挥其在推动自动推理与可靠软件系统发展方面的潜力。

背景与挑战

背景概述

Verus_Training_Data数据集由相关研究团队于近期构建，旨在支持形式化验证与代码生成领域的前沿探索。该数据集的核心研究问题聚焦于提升自动化定理证明与程序调试的效能，通过整合大量证明生成与调试样本，为SAFE和VeruSyn等系统提供高质量的训练资源。其创建反映了人工智能在软件工程与数学验证交叉领域的深化应用，有望推动自动化推理工具向更高可靠性、可扩展性方向发展，对强化智能系统的安全性与严谨性具有显著影响力。

当前挑战

该数据集致力于应对形式化验证中自动化证明生成与复杂代码调试的固有挑战，包括处理长链推理、错误定位及超时控制等难题。在构建过程中，研究人员需克服数据标注的高成本与专业性要求，平衡不同任务类型（如证明生成与调试）的样本分布，并确保轨迹数据的质量与多样性，以真实反映实际验证场景中的动态性与复杂性。

常用场景

经典使用场景

在形式化验证与定理证明领域，Verus_Training_Data 作为大规模训练语料，其经典应用场景在于支持基于机器学习的自动化证明系统开发。该数据集通过提供海量的证明生成与调试样本，使模型能够学习复杂的逻辑推理模式，从而在形式化验证任务中实现从自然语言描述到严格数学证明的自动转换。这一过程不仅提升了证明生成的效率，还显著增强了系统处理复杂算法和软件系统规范的能力。

解决学术问题

该数据集有效应对了形式化方法中长期存在的可扩展性与自动化瓶颈。通过提供结构化的证明轨迹数据，它助力研究人员探索如何将深度学习技术融入定理证明，以解决传统交互式证明器依赖专家手工操作、难以处理大规模代码验证的难题。其意义在于推动了可验证人工智能的发展，为构建高可靠软件系统提供了数据驱动的全新途径，并在程序验证、安全关键系统等领域产生了深远影响。

实际应用

在实际工程层面，Verus_Training_Data 能够直接应用于开发智能辅助验证工具，例如集成到软件开发流程中，自动检测代码中的逻辑错误或安全漏洞。这些工具可服务于操作系统、嵌入式系统或区块链智能合约等对正确性要求极高的领域，通过自动化部分验证工作，降低人工验证成本，提升软件交付的可靠性与安全性，从而在金融、航空航天及基础设施软件中发挥关键作用。

数据集最近研究