five

JetBrains-Research/diff-xyz

收藏
Hugging Face2025-11-14 更新2025-10-18 收录
下载链接:
https://hf-mirror.com/datasets/JetBrains-Research/diff-xyz
下载链接
链接失效反馈
官方服务:
资源简介:
Diff-XYZ是一个用于评估代码变更理解能力的数据集,包含从CommitPackFT数据集中筛选出的1000个真实世界代码编辑案例。每个案例包括原始代码内容(old_code)、修改后的代码内容(new_code)和多种差分表示(udiff, udiff-h, udiff-l, search-replace)。这些格式使得可以对大型语言模型在三种代码编辑任务上的能力进行评估:应用变更、撤销变更和生成差分。

Diff-XYZ is a dataset for evaluating code change understanding capabilities, containing 1,000 real-world code edit instances sampled and filtered from the CommitPackFT dataset. Each instance includes the original code content (old_code), modified code content (new_code), and multiple diff representations (udiff, udiff-h, udiff-l, search-replace). These formats enable the evaluation of large language models on three code editing tasks: applying changes, reversing changes, and generating diffs.
提供机构:
JetBrains-Research
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作