kejian/codeparrot-train-more-filter-3.3b-cleaned
收藏Hugging Face2023-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kejian/codeparrot-train-more-filter-3.3b-cleaned
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- machine-generated
source_datasets:
- codeparrot
task_categories:
- text-classification
tags:
- pretraining-with-human-feedback
- pep8
- python
- codeparrot
size_categories:
- 100K<n<1M
license: mit
---
注释生成者:
- 机器生成
源数据集:
- 代码鹦鹉(Codeparrot)
任务类别:
- 文本分类
标签:
- 带人类反馈的预训练
- PEP8
- Python
- 代码鹦鹉
样本规模类别:
- 10万 < 样本量 < 100万
许可证:
- MIT许可证
提供机构:
kejian
原始信息汇总
数据集概述
数据集创建者
- 类型:机器生成
数据来源
- 来源数据集:codeparrot
任务类别
- 类别:文本分类
标签
- 预训练与人类反馈
- pep8
- python
- codeparrot
数据集规模
- 规模范围:100,000 < n < 1,000,000
许可证
- 许可证类型:MIT



