eastwind/open_hermes_2.5_magicoder_evol_instruct_chatml
收藏Hugging Face2024-02-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eastwind/open_hermes_2.5_magicoder_evol_instruct_chatml
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是[teknium/OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5)和[ise-uiuc/Magicoder-Evol-Instruct-110K](https://huggingface.co/datasets/ise-uiuc/Magicoder-Evol-Instruct-110K)的合并版本,使用了chatml格式进行训练,并且过滤了最大2048个tokens的数据。
该数据集是[teknium/OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5)和[ise-uiuc/Magicoder-Evol-Instruct-110K](https://huggingface.co/datasets/ise-uiuc/Magicoder-Evol-Instruct-110K)的合并版本,使用了chatml格式进行训练,并且过滤了最大2048个tokens的数据。
提供机构:
eastwind
原始信息汇总
数据集概述
数据集名称
OpenHermes 2.5 + MagiCoder Evol Instruct 110k
数据集信息
特征
- text: 数据类型为字符串(string)
- tokens: 数据类型为64位整数(int64)
数据分割
- train:
- 字节数: 1881174958.136154
- 样本数: 1103225
数据集大小
- 下载大小: 958650488
- 数据集大小: 1881174958.136154
配置
- default:
- 数据文件路径: data/train-*



