livecodebench/code_generation

收藏

Hugging Face2024-06-13 更新2024-04-19 收录

下载链接：

https://hf-mirror.com/datasets/livecodebench/code_generation

下载链接

链接失效反馈

官方服务：

资源简介：

LiveCodeBench是一个动态更新的基准，用于全面评估大型语言模型在代码相关能力上的表现，包括代码生成、自我修复、测试输出预测和代码执行。数据集包含从LeetCode、AtCoder和Codeforces收集的400个问题，每个问题包括问题描述、输入/输出示例和隐藏测试用例，并标有难度级别和发布日期。

提供机构：

livecodebench

原始信息汇总

数据集概述

数据集名称

LiveCodeBench

数据集目的

LiveCodeBench是一个实时更新的基准，用于全面评估大型语言模型（LLMs）在代码相关能力上的表现。特别关注代码生成、自我修复、测试输出预测和代码执行等方面的评估。

数据集内容

问题来源：数据集中的问题主要从LeetCode、AtCoder和Codeforces等竞赛编程网站收集。
问题数量：目前包含400个问题。
问题组成：每个问题实例包括问题描述、输入/输出示例以及隐藏测试案例（平均超过59个）。
附加信息：每个问题都标有难度级别和发布日期，以便衡量模型在不同时间窗口的性能。

数据集使用场景

代码生成：评估模型生成正确且高效解决方案的能力。
自我修复：使用测试案例反馈评估模型的自我修复能力。

搜集汇总

数据集介绍

main_image_url

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作