apcl/autorepair
收藏Hugging Face2023-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/apcl/autorepair
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于模型微调和预训练的数据文件,以及用于生成srcml文件的原始数据。具体包括bin文件、fundats文件、raw_data文件、srcml_prediction_bug文件、srcml_predictions文件、train.bin文件和val.bin文件。数据集的主要用途是无损失语法树生成和零样本错误纠正。
提供机构:
apcl
原始信息汇总
数据集文件
| 文件名 | 描述 |
|---|---|
| bin.tar.gz | 用于微调模型以修复语法错误的二进制文件 |
| fundats.tar.gz | 用于在零样本设置中生成带有错误修正的srcml的数据文件 |
| raw_data.tar.gz | 用于微调模型以修复语法错误的原始数据 |
| srcml_prediction_bug.tar.gz | 带有语法错误的代码的测试集生成的srcml |
| srcml_predictions.tar.gz | 不带有语法错误的代码的测试集生成的srcml |
| train.bin.gz | 用于在训练集上预训练的二进制文件 |
| val.bin.gz | 用于在验证集上预训练的二进制文件 |
数据集令牌数量
| 数据集 | 令牌数量 |
|---|---|
| 微调训练集 | 39,413,485 令牌 |
| 预训练训练集 | 48,774,749,459 令牌 |



