five

adamo1139/rawrr_v1

收藏
Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/adamo1139/rawrr_v1
下载链接
链接失效反馈
官方服务:
资源简介:
rawrr_v1是一个高度实验性的配对风格数据集,旨在帮助去污染所谓的基础模型。`chosen`字段包含未经指令调优的基础模型输出,而`rejected`字段包含在公开发布前被污染的模型输出。数据集基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf,并替换了部分字段。生成参数包括max_tokens、temperature等。存在的问题包括`chosen`字段中的输出被截断和`rejected`字段中的输出以I 开头。

rawrr_v1是一个高度实验性的配对风格数据集,旨在帮助去污染所谓的基础模型。`chosen`字段包含未经指令调优的基础模型输出,而`rejected`字段包含在公开发布前被污染的模型输出。数据集基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf,并替换了部分字段。生成参数包括max_tokens、temperature等。存在的问题包括`chosen`字段中的输出被截断和`rejected`字段中的输出以I 开头。
提供机构:
adamo1139
原始信息汇总

数据集概述

数据集名称

  • rawrr_v1

数据集描述

  • 用途:用于帮助净化所谓的“基础”模型,旨在恢复未经指导微调的原始模型状态。
  • 结构:包含两个主要字段:
    • chosen:包含未经指导微调的基础模型输出的原始格式数据。
    • rejected:包含在公开发布前已被污染的模型输出。

数据集内容

  • 内容性质:据知,该数据集不包含任何有毒或仇恨内容,也不包含在极权国家可能被视为非法的内容。
  • 提示内容:所有提示均为良性。

数据集来源

  • 基础数据集:基于HuggingFaceH4/no_robots和winglian/no_robots_rlhf。
  • 修改内容
    • 保留了promptsourceid字段。
    • 替换了chosenrejected字段的内容。
    • 重写了system字段为“A chat.”。

数据集许可证

  • 许可证:cc-by-nc-4.0

数据集生成参数

  • 生成参数
    • max_tokens: 600
    • temperature: 0.8
    • top_k: 40
    • top_p: 0.8
    • repetition_penalty: 1.12

数据集版本问题

  • 版本问题
    • 由于设置max_tokens为600,部分chosen字段中的生成内容被截断。
    • rejected字段中的许多响应以“I”开头,可能影响模型后续的第一人称视角响应能力。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作