vicgalle/configurable-system-prompt-multitask
收藏Hugging Face2024-04-23 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/vicgalle/configurable-system-prompt-multitask
下载链接
链接失效反馈官方服务:
资源简介:
我们发布了用于多任务实验的合成数据集,该数据集来源于论文《使用合成偏好数据配置语言模型的安全调优》。数据集包含两个主要来源的示例:一是基于SOLAR-Instruct模型的安全任务自我批评,使用两种系统提示来学习不同的行为;二是来自`truthy-dpo`数据集,用于增强模型的真实性,使用两种类型的系统提示。数据集包含以下字段:`system`(系统提示)、`prompt`(用户提示)、`chosen`(首选答案)、`rejected`(非首选答案)。为了使用`trl`库进行微调,您需要使用一个允许系统提示的模型,或者将`system`和`prompt`字段连接成一个字段。
提供机构:
vicgalle
原始信息汇总
数据集概述
数据集基本信息
- 名称: Configurable System Prompt Multi-task Dataset
- 特征:
system: 系统提示,字符串类型prompt: 用户提示,字符串类型chosen: 首选答案,字符串类型rejected: 非首选答案,字符串类型task: 任务描述,字符串类型
- 分割:
train: 1952个样本,总大小3747667字节
- 下载大小: 2087335字节
- 数据集大小: 3747667字节
- 许可证: cc-by-4.0
任务与语言
- 任务类别: 文本生成
- 语言: 英语
标签与大小分类
- 标签:
- 安全
- 系统提示
- 合成
- dpo
- 大小分类: 1K<n<10K



