matorus/coder
收藏Hugging Face2023-07-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matorus/coder
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于微调[human-eval](https://github.com/openai/human-eval)的训练数据集。数据集由多个来源的数据集组合而成,包括sahil2801/CodeAlpaca-20k、sahil2801/code_instructions_120k、mhhmm/leetcode-solutions-python和teknium1/GPTeacher。此外,还提供了一个生成数据集的脚本[create_dataset.py](./create_dataset.py)。
本数据集为用于微调[人类评估数据集(human-eval)](https://github.com/openai/human-eval)的训练数据集,由多源数据集融合构建而成,涵盖sahil2801/CodeAlpaca-20k、sahil2801/code_instructions_120k、mhhmm/leetcode-solutions-python以及teknium1/GPTeacher四类数据集。此外,配套提供了数据集生成脚本[create_dataset.py](./create_dataset.py)。
提供机构:
matorus
原始信息汇总
数据集概述
任务类别
- 文本生成
数据集用途
- 用于微调 human-eval 的训练数据集。
数据集来源
- sahil2801/CodeAlpaca-20k
- sahil2801/code_instructions_120k
- mhhmm/leetcode-solutions-python
- teknium1/GPTeacher



