five

matorus/coder

收藏
Hugging Face2023-07-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matorus/coder
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于微调[human-eval](https://github.com/openai/human-eval)的训练数据集。数据集由多个来源的数据集组合而成,包括sahil2801/CodeAlpaca-20k、sahil2801/code_instructions_120k、mhhmm/leetcode-solutions-python和teknium1/GPTeacher。此外,还提供了一个生成数据集的脚本[create_dataset.py](./create_dataset.py)。

本数据集为用于微调[人类评估数据集(human-eval)](https://github.com/openai/human-eval)的训练数据集,由多源数据集融合构建而成,涵盖sahil2801/CodeAlpaca-20k、sahil2801/code_instructions_120k、mhhmm/leetcode-solutions-python以及teknium1/GPTeacher四类数据集。此外,配套提供了数据集生成脚本[create_dataset.py](./create_dataset.py)。
提供机构:
matorus
原始信息汇总

数据集概述

任务类别

  • 文本生成

数据集用途

数据集来源

  • sahil2801/CodeAlpaca-20k
  • sahil2801/code_instructions_120k
  • mhhmm/leetcode-solutions-python
  • teknium1/GPTeacher

数据集生成脚本

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作