five

kejian/codeparrot-train-more-filter-3.3b-cleaned

收藏
Hugging Face2023-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kejian/codeparrot-train-more-filter-3.3b-cleaned
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - machine-generated source_datasets: - codeparrot task_categories: - text-classification tags: - pretraining-with-human-feedback - pep8 - python - codeparrot size_categories: - 100K<n<1M license: mit ---

注释生成者: - 机器生成 源数据集: - 代码鹦鹉(Codeparrot) 任务类别: - 文本分类 标签: - 带人类反馈的预训练 - PEP8 - Python - 代码鹦鹉 样本规模类别: - 10万 < 样本量 < 100万 许可证: - MIT许可证
提供机构:
kejian
原始信息汇总

数据集概述

数据集创建者

  • 类型:机器生成

数据来源

  • 来源数据集:codeparrot

任务类别

  • 类别:文本分类

标签

  • 预训练与人类反馈
  • pep8
  • python
  • codeparrot

数据集规模

  • 规模范围:100,000 < n < 1,000,000

许可证

  • 许可证类型:MIT
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作