five

ParasiticRogue/Bluemoon-Light

收藏
Hugging Face2024-07-10 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/ParasiticRogue/Bluemoon-Light
下载链接
链接失效反馈
官方服务:
资源简介:
Bluemoon数据集的最新版本经过修剪、清理和语法检查,与之前的版本分离,并进行了编辑以优化parquet量化(如exl2或gguf),使得在使用时模型在创造性活动中更加稳定。数据集中的每一行长度都小于2048个标记,总共有832行,并在每侧添加了额外的停止标记以提高性能。如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,用户可以编辑CSV文件的顶部部分和/或停止标记,以适应自己的模板并自行转换。自动parquet转换器的文件可能缺少某些行或未完成/未修剪,因此建议使用主文件中包含的文件。

Bluemoon数据集的最新版本经过修剪、清理和语法检查,与之前的版本分离,并进行了编辑以优化parquet量化(如exl2或gguf),使得在使用时模型在创造性活动中更加稳定。数据集中的每一行长度都小于2048个标记,总共有832行,并在每侧添加了额外的停止标记以提高性能。如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,用户可以编辑CSV文件的顶部部分和/或停止标记,以适应自己的模板并自行转换。自动parquet转换器的文件可能缺少某些行或未完成/未修剪,因此建议使用主文件中包含的文件。
提供机构:
ParasiticRogue
原始信息汇总

数据集概述

许可证

  • Apache 2.0

任务类别

  • 文本生成

语言

  • 英语

标签

  • 不适合所有观众

数据集描述

  • 数据集经过修剪、清理和语法检查,与之前的版本独立。
  • 为了更好的parquet量化(如exl2或gguf),数据集经过编辑,使得模型在使用时更加稳定。
  • 每行数据长度不超过2048个token,共832行,每行数据两侧有额外的停止token以提高性能。
  • 如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,可以编辑CSV文件的顶部部分和/或停止token以适应自己的模板并自行转换。
  • 自动parquet转换器文件可能缺少某些行或未完成/未修剪,建议使用主文件中包含的文件。

原始模板数据集

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作