five

coseal/Magicoder-Evol-Instruct-110K-sft

收藏
Hugging Face2024-03-17 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/coseal/Magicoder-Evol-Instruct-110K-sft
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: instruction dtype: string - name: response dtype: string splits: - name: train num_bytes: 223536539 num_examples: 100772 download_size: 124103286 dataset_size: 223536539 configs: - config_name: default data_files: - split: train path: data/train-* task_categories: - text-generation tags: - instruction-tuning - SFT - code - coding problems size_categories: - 100K<n<1M --- This dataset is a fork of https://huggingface.co/datasets/ise-uiuc/Magicoder-Evol-Instruct-110K. It is just a version with the samples of [CodeUltraFeedback](https://huggingface.co/datasets/coseal/CodeUltraFeedback_binarized) filtered out.
提供机构:
coseal
原始信息汇总

数据集概述

数据集特征

  • instruction:数据类型为字符串。
  • response:数据类型为字符串。

数据集分割

  • train:包含100,772个样本,总大小为223,536,539字节。

数据集大小

  • 下载大小:124,103,286字节。
  • 数据集总大小:223,536,539字节。

配置

  • default:训练数据路径为data/train-*

任务类别

  • 文本生成

标签

  • 指令调整
  • SFT
  • 代码
  • 编程问题

大小类别

  • 100K<n<1M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作