ParasiticRogue/Bluemoon-Light
收藏Hugging Face2024-07-10 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/ParasiticRogue/Bluemoon-Light
下载链接
链接失效反馈官方服务:
资源简介:
Bluemoon数据集的最新版本经过修剪、清理和语法检查,与之前的版本分离,并进行了编辑以优化parquet量化(如exl2或gguf),使得在使用时模型在创造性活动中更加稳定。数据集中的每一行长度都小于2048个标记,总共有832行,并在每侧添加了额外的停止标记以提高性能。如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,用户可以编辑CSV文件的顶部部分和/或停止标记,以适应自己的模板并自行转换。自动parquet转换器的文件可能缺少某些行或未完成/未修剪,因此建议使用主文件中包含的文件。
Bluemoon数据集的最新版本经过修剪、清理和语法检查,与之前的版本分离,并进行了编辑以优化parquet量化(如exl2或gguf),使得在使用时模型在创造性活动中更加稳定。数据集中的每一行长度都小于2048个标记,总共有832行,并在每侧添加了额外的停止标记以提高性能。如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,用户可以编辑CSV文件的顶部部分和/或停止标记,以适应自己的模板并自行转换。自动parquet转换器的文件可能缺少某些行或未完成/未修剪,因此建议使用主文件中包含的文件。
提供机构:
ParasiticRogue
原始信息汇总
数据集概述
许可证
- Apache 2.0
任务类别
- 文本生成
语言
- 英语
标签
- 不适合所有观众
数据集描述
- 数据集经过修剪、清理和语法检查,与之前的版本独立。
- 为了更好的parquet量化(如exl2或gguf),数据集经过编辑,使得模型在使用时更加稳定。
- 每行数据长度不超过2048个token,共832行,每行数据两侧有额外的停止token以提高性能。
- 如果使用的模型不是Vicuna、ChatML、Llama3或专门的Chat-Vicuna,可以编辑CSV文件的顶部部分和/或停止token以适应自己的模板并自行转换。
- 自动parquet转换器文件可能缺少某些行或未完成/未修剪,建议使用主文件中包含的文件。



