five

apcl/autorepair

收藏
Hugging Face2023-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/apcl/autorepair
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于模型微调和预训练的数据文件,以及用于生成srcml文件的原始数据。具体包括bin文件、fundats文件、raw_data文件、srcml_prediction_bug文件、srcml_predictions文件、train.bin文件和val.bin文件。数据集的主要用途是无损失语法树生成和零样本错误纠正。
提供机构:
apcl
原始信息汇总

数据集文件

文件名 描述
bin.tar.gz 用于微调模型以修复语法错误的二进制文件
fundats.tar.gz 用于在零样本设置中生成带有错误修正的srcml的数据文件
raw_data.tar.gz 用于微调模型以修复语法错误的原始数据
srcml_prediction_bug.tar.gz 带有语法错误的代码的测试集生成的srcml
srcml_predictions.tar.gz 不带有语法错误的代码的测试集生成的srcml
train.bin.gz 用于在训练集上预训练的二进制文件
val.bin.gz 用于在验证集上预训练的二进制文件

数据集令牌数量

数据集 令牌数量
微调训练集 39,413,485 令牌
预训练训练集 48,774,749,459 令牌
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作