ise-uiuc/Magicoder-Evol-Instruct-110K
收藏Hugging Face2023-12-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ise-uiuc/Magicoder-Evol-Instruct-110K
下载链接
链接失效反馈官方服务:
资源简介:
这是一个经过去污染处理的evol-codealpaca-v1数据集的版本。去污染处理的方式与StarCoder项目中的去污染过程相同。数据集的主要任务类别包括文本生成和对话生成。
This is a decontaminated version of the evol-codealpaca-v1 dataset. The decontamination process follows the same procedure as that used in the StarCoder project. The main task categories of this dataset include text generation and dialogue generation.
提供机构:
ise-uiuc
原始信息汇总
数据集概述
数据集版本
- 版本名称: evol-codealpaca-v1
数据处理
- 处理方式: 去污染处理
- 处理方法: 与StarCoder(bigcode去污染流程)相同
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含11万条代码生成和调试任务的文本数据集,格式为JSON,主要用于文本生成任务。数据集涵盖多种编程场景,包括代码修复、算法实现和数据预处理等,适用于训练和评估代码生成模型。
以上内容由遇见数据集搜集并总结生成



