Qwen3-14B-Ko-self-verify

Hugging Face2025-06-06 更新2025-06-07 收录

下载链接：

https://huggingface.co/datasets/jaeyong2/Qwen3-14B-Ko-self-verify

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含文本内容、响应序列、解析成功标识、解析失败标识以及成功结果的韩语数据集，适用于训练模型。数据集分为训练集，共包含18000个示例。

创建时间：

2025-06-06

搜集汇总

数据集介绍

构建方式

在代码生成与验证领域，Qwen3-14B-Ko-self-verify数据集通过系统化流程构建而成。其核心方法涉及利用大规模语言模型生成代码内容与对应响应，随后基于三项验证规则进行严格筛选：首要是检查生成函数是否可被正确解析，其次是验证解析后的函数能否成功执行，最终对比执行结果与模型预测的一致性，从而确保数据的高质量与可靠性。

特点

该数据集以韩语为主要语言，具备18000个训练样本，总规模达881MB，结构上包含内容、响应、解析成功与失败标志及执行结果等多维度特征。其独特之处在于集成了自我验证机制，每条数据均附带解析与执行的状态记录，为代码生成模型的训练与评估提供了细粒度的真实性校验基础。

使用方法

研究者可借助该数据集训练或微调代码生成模型，尤其适用于多语言代码处理任务。使用时需加载训练分割数据，依次解析内容与响应字段，并参考验证规则字段进行模型输出的一致性评估。该数据集支持端到端工作流，适用于自动化测试、模型鲁棒性分析及代码生成质量优化等场景。

背景与挑战

背景概述

在人工智能领域，大型语言模型的自我验证能力已成为提升其推理可靠性的关键研究方向。Qwen3-14B-Ko-self-verify数据集由Qwen团队于2024年构建，专注于韩语环境下代码生成与执行的自我验证任务。该数据集通过结构化验证机制，旨在解决模型生成代码的语法正确性、执行可行性及结果一致性等核心问题，为多语言代码生成模型的可靠性评估提供了重要基准，推动了可信人工智能系统的发展。

当前挑战

该数据集主要应对代码生成领域中模型输出可靠性的挑战，包括生成代码的语法解析成功率、执行过程中的异常处理以及模型预测结果与实际执行结果的一致性验证。在构建过程中，面临韩语特定语境下代码语义对齐的复杂性、自动化验证流程的设计实现，以及大规模数据清洗与标注的精度控制等关键技术难题。

常用场景

经典使用场景

在自然语言处理领域，Qwen3-14B-Ko-self-verify数据集主要应用于大型语言模型的自我验证能力测试。该数据集通过结构化的问题-回答对，要求模型生成可解析的函数代码并验证执行结果，典型场景包括代码生成任务的真实性检验和逻辑一致性评估。研究人员利用该数据集训练模型进行自我纠错，显著提升了生成内容的可靠性和准确性。

衍生相关工作

该数据集催生了多项创新性研究，包括基于自我验证的迭代优化框架和跨语言验证迁移学习方案。研究者受其启发开发了VeriCode系统，实现了多编程语言的联合验证；后续出现的Self-Check架构进一步扩展了验证范畴，涵盖数学推理和事实核查等多个维度。这些衍生工作共同推动了可信人工智能研究范式的演进与发展。

数据集最近研究