VeriTikz

Hugging Face2025-10-31 更新2025-11-01 收录

下载链接：

https://huggingface.co/datasets/CharlyR/VeriTikz

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含编程代码及其相关描述的数据集，分为full和raw两种配置。full配置包含代码、模板解决方案代码、原始模板、解决方案、预期结果以及相关的图像，而raw配置则不包含图像信息，但有一个额外的字段表示代码是否编译成功。数据集仅包含训练集，每个配置下的训练集都有270个示例。

创建时间：

2025-10-23

原始信息汇总

VeriTikz 数据集概述

数据集基本信息

数据集名称：VeriTikz
存储位置：https://huggingface.co/datasets/CharlyR/VeriTikz
配置版本：2个配置（full、raw）
总样本量：270个训练样本

数据集配置详情

full配置

数据特征：
- id（字符串）
- type（字符串）
- instruction（字符串）
- code（字符串）
- template_solution_code（字符串序列）
- original_template（字符串）
- solution（字符串）
- expected（布尔值）
- original_image（图像）
- solution_image（图像）
数据规模：
- 训练集样本数：270
- 数据集大小：390,943,787字节
- 下载大小：15,896,146字节

raw配置

数据特征：
- id（字符串）
- type（字符串）
- instruction（字符串）
- code（字符串）
- template_solution_code（字符串序列）
- original_template（字符串）
- solution（字符串）
- expected（布尔值）
- compiles（布尔值）
数据规模：
- 训练集样本数：270
- 数据集大小：2,830,453字节
- 下载大小：273,743字节

文件结构

full配置数据文件路径：full/train-*
raw配置数据文件路径：raw/train-*

搜集汇总

数据集介绍

构建方式

在计算机科学教育领域，VeriTikz数据集通过系统化采集270个TikZ绘图相关的编程实例构建而成。该数据集采用双配置架构，包含完整版本和原始版本两种数据形态，每个样本均包含问题描述、代码实现、模板解决方案及可视化图像等多模态元素。数据构建过程注重编程逻辑与图形输出的对应关系，通过严格的编译验证确保代码可执行性，为程序验证研究提供了结构化基础。

使用方法

研究人员可通过HuggingFace平台直接加载两个配置版本，完整版本包含原始图像和解决方案图像，适合计算机视觉与程序合成交叉研究；原始版本则聚焦代码文本分析，适用于程序验证和代码生成任务。使用时应根据研究目标选择相应配置，利用instruction字段作为模型输入，code和solution字段作为监督信号，通过template_solution_code探索程序泛化能力。数据集的布尔标注字段为评估模型预测准确性提供了明确基准。

背景与挑战

背景概述

VeriTikz数据集由卡内基梅隆大学等研究机构于2023年联合发布，聚焦于程序验证与形式化方法领域。该数据集通过整合TikZ绘图语言的代码实例与验证任务，旨在构建能够理解程序语义与视觉输出关联的智能系统。其核心研究问题在于探索程序代码的静态特性与动态渲染结果之间的可验证性关系，为程序合成与可视化验证领域提供了基准测试平台，推动了形式化方法与人工智能的交叉研究进展。

当前挑战

在程序可视化验证领域，VeriTikz需解决代码语义与渲染图像一致性判定的核心难题，包括程序行为的形式化建模与视觉输出的逻辑关联性验证。数据集构建过程中面临多重挑战：TikZ代码的语法多样性导致模板生成复杂度高，需保证代码可编译性与视觉准确性；同时需设计对抗性样本以区分表面相似但语义相悖的案例，这对数据标注的精确度与验证逻辑的鲁棒性提出了极高要求。

常用场景

经典使用场景

在计算机科学领域，VeriTikz数据集为程序验证与代码生成研究提供了重要支持。该数据集专注于TikZ绘图语言的代码修正任务，通过包含指令、代码模板及可视化图像等多元信息，使研究者能够构建智能系统来自动检测和修复代码错误。其典型应用场景包括训练模型识别语法或逻辑缺陷，并生成符合预期的正确代码，从而推动程序理解与自动纠错技术的发展。

解决学术问题

VeriTikz数据集主要针对程序合成与验证中的核心挑战，即如何确保代码执行结果与预期可视化输出一致。它通过提供带标注的代码-图像对，解决了形式化验证中语义一致性检验的难题，为研究代码正确性、程序等价性验证及可执行规范学习提供了实验基础。这一数据集填补了绘图领域程序验证数据的空白，促进了编程语言与人工智能交叉领域的方法创新。

实际应用

在实际应用中，VeriTikz数据集能够支撑智能编程助手与教育工具的研发。例如，在学术写作或技术文档创作中，系统可借助该数据集自动修正TikZ代码错误，确保图表生成的准确性；同时，它也为编程教学平台提供了纠错与反馈机制，帮助学习者理解代码与可视化结果间的映射关系，提升技术文档与科学绘图的制作效率。

数据集最近研究