five

vibepass

收藏
Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/Salesforce/vibepass
下载链接
链接失效反馈
官方服务:
资源简介:
VIBEPASS数据集是一个用于评估大型语言模型(LLM)在故障针对性推理方面能力的基准数据集,特别关注于错误检测和修复。该数据集包含173个竞争性编程问题的示例,每个问题都配有LLM生成的解决方案,这些解决方案能够通过部分测试套件但在语义边缘案例上失败。每个样本包含以下字段:question_id(问题唯一标识符)、question_title(问题标题)、question_content(问题描述及约束条件)、platform(问题来源平台)、starter_code(初始代码模板)、difficulty(问题难度级别)、silver_solution(正确的人类解决方案)、buggy_solution(包含错误的模型生成解决方案)和test_checker(验证测试输入正确性的代码)。该数据集适用于错误检测、错误定位和错误修复等任务。
提供机构:
Salesforce
创建时间:
2026-03-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作