adamo1139/rawrr_v1
收藏Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/adamo1139/rawrr_v1
下载链接
链接失效反馈官方服务:
资源简介:
rawrr_v1是一个高度实验性的配对风格数据集,旨在帮助去污染所谓的基础模型。`chosen`字段包含未经指令调优的基础模型输出,而`rejected`字段包含在公开发布前被污染的模型输出。数据集基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf,并替换了部分字段。生成参数包括max_tokens、temperature等。存在的问题包括`chosen`字段中的输出被截断和`rejected`字段中的输出以I 开头。
rawrr_v1是一个高度实验性的配对风格数据集,旨在帮助去污染所谓的基础模型。`chosen`字段包含未经指令调优的基础模型输出,而`rejected`字段包含在公开发布前被污染的模型输出。数据集基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf,并替换了部分字段。生成参数包括max_tokens、temperature等。存在的问题包括`chosen`字段中的输出被截断和`rejected`字段中的输出以I 开头。
提供机构:
adamo1139
原始信息汇总
数据集概述
数据集名称
- rawrr_v1
数据集描述
- 用途:用于帮助净化所谓的“基础”模型,旨在恢复未经指导微调的原始模型状态。
- 结构:包含两个主要字段:
chosen:包含未经指导微调的基础模型输出的原始格式数据。rejected:包含在公开发布前已被污染的模型输出。
数据集内容
- 内容性质:据知,该数据集不包含任何有毒或仇恨内容,也不包含在极权国家可能被视为非法的内容。
- 提示内容:所有提示均为良性。
数据集来源
- 基础数据集:基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf。
- 修改内容:
- 保留了
prompt、source和id字段。 - 替换了
chosen和rejected字段的内容。 - 重写了
system字段为“A chat.”。
- 保留了
数据集许可证
- 许可证:cc-by-nc-4.0
数据集生成参数
- 生成参数:
max_tokens: 600temperature: 0.8top_k: 40top_p: 0.8repetition_penalty: 1.12
数据集版本问题
- 版本问题:
- 由于设置
max_tokens为600,部分chosen字段中的生成内容被截断。 rejected字段中的许多响应以“I”开头,可能影响模型后续的第一人称视角响应能力。
- 由于设置



