livecodebench/execution-v2

Name: livecodebench/execution-v2
Creator: livecodebench
Published: 2024-11-26 17:50:29
License: 暂无描述

Hugging Face2024-11-26 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/livecodebench/execution-v2

下载链接

链接失效反馈

官方服务：

资源简介：

LiveCodeBench-Execution数据集主要包含与代码执行相关的数据，特征包括问题ID、ID、函数名称、代码、输入、输出、步骤数、问题ID、竞赛ID、竞赛日期和难度。数据集分为训练集和测试集，每个集包含479个示例。数据集的下载大小为142966字节，总大小为435546字节。数据集的许可证为cc，任务类别为文本到文本生成，标签为代码执行，规模类别为小于1K。

提供机构：

livecodebench

原始信息汇总

数据集概述

数据集特征

question_id：整数类型
id：字符串类型
function_name：字符串类型
code：字符串类型
input：字符串类型
output：字符串类型
numsteps：整数类型
problem_id：整数序列类型
contest_id：字符串类型
contest_date：时间戳类型（微秒）
difficulty：字符串类型

数据集划分

训练集：
- 数据量：479个样本
- 存储大小：217773字节
测试集：
- 数据量：479个样本
- 存储大小：217773字节

数据集大小

下载大小：142966字节
数据集总大小：435546字节

数据文件配置

默认配置：
- 训练数据路径：data/train-*
- 测试数据路径：data/test-*

搜集汇总

数据集介绍

构建方式

LiveCodeBench-Execution数据集的构建，是通过采集编程竞赛中选手的代码执行记录，涵盖问题标识、代码内容、输入输出结果、执行步骤等详细信息，旨在为代码执行相关研究提供实证基础。数据集按照竞赛日期、问题难度等维度进行分类，确保了数据的多维度可用性。

特点

该数据集的特点在于，它包含真实的代码执行数据，不仅提供了代码文本，还包含了代码的执行输入和输出，这对于研究代码执行行为、评估代码质量以及生成式编程任务尤为珍贵。此外，数据集的多样性体现在涵盖了不同难度级别的问题，以及不同时间点的竞赛数据，有助于模型适应多种编程场景。

使用方法

使用LiveCodeBench-Execution数据集，用户需首先下载对应的测试集文件。之后，可以通过数据集中的字段如问题标识、代码内容、输入输出对等进行数据预处理。针对特定的研究任务，如文本到文本生成，用户可利用数据集中的代码执行结果来训练和测试模型，从而提高模型在代码理解和生成方面的性能。

背景与挑战

背景概述

LiveCodeBench-Execution数据集，其诞生于编程语言处理与代码执行研究领域，旨在为研究者提供一个评估代码执行理解和生成能力的基准。该数据集由知名研究机构构建于近年，汇聚了编程竞赛中的代码执行实例，其核心研究问题聚焦于如何通过机器学习技术准确理解和预测代码执行结果。LiveCodeBench-Execution数据集以其独特的视角和丰富的数据资源，对编程语言处理领域产生了深远的影响，推动了相关技术的进步与发展。

当前挑战

该数据集在研究领域内所面临的挑战主要包括两个方面：一是解决编程语言处理中的代码执行理解和生成问题，这要求模型能够准确预测代码执行后的输出结果；二是构建过程中的挑战，如确保数据质量，处理代码的多样性和复杂性，以及数据标注的一致性和准确性。此外，数据集规模相对较小，也限制了模型训练的充分性和泛化能力，为研究带来了额外的挑战。

常用场景

经典使用场景

在程序设计与软件开发领域，LiveCodeBench-Execution数据集被广泛应用于代码执行行为的分析。该数据集通过提供代码片段及其执行结果，成为研究代码执行过程、优化程序性能的重要资源。其经典使用场景在于模拟编程竞赛环境，为研究者提供了一个评估程序执行效率与正确性的标准平台。

实际应用

在实际应用中，LiveCodeBench-Execution数据集可用于训练和测试机器学习模型，以预测代码执行结果或诊断程序错误。软件开发者和自动化测试工程师可借助该数据集提高代码质量，优化软件测试流程，提升软件开发效率。

衍生相关工作

LiveCodeBench-Execution数据集的衍生工作涵盖了代码生成、程序理解等多个方面。研究者基于此数据集开发了一系列算法和工具，用于代码执行行为分析、错误检测与自动修复，进一步推动了软件工程与程序分析领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集