five

ise-uiuc/Magicoder-Evol-Instruct-110K

收藏
Hugging Face2023-12-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ise-uiuc/Magicoder-Evol-Instruct-110K
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个经过去污染处理的evol-codealpaca-v1数据集的版本。去污染处理的方式与StarCoder项目中的去污染过程相同。数据集的主要任务类别包括文本生成和对话生成。

This is a decontaminated version of the evol-codealpaca-v1 dataset. The decontamination process follows the same procedure as that used in the StarCoder project. The main task categories of this dataset include text generation and dialogue generation.
提供机构:
ise-uiuc
原始信息汇总

数据集概述

数据集版本

  • 版本名称: evol-codealpaca-v1

数据处理

  • 处理方式: 去污染处理
  • 处理方法: 与StarCoder(bigcode去污染流程)相同
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个包含11万条代码生成和调试任务的文本数据集,格式为JSON,主要用于文本生成任务。数据集涵盖多种编程场景,包括代码修复、算法实现和数据预处理等,适用于训练和评估代码生成模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作