five

vicgalle/configurable-system-prompt-multitask

收藏
Hugging Face2024-04-23 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/vicgalle/configurable-system-prompt-multitask
下载链接
链接失效反馈
官方服务:
资源简介:
我们发布了用于多任务实验的合成数据集,该数据集来源于论文《使用合成偏好数据配置语言模型的安全调优》。数据集包含两个主要来源的示例:一是基于SOLAR-Instruct模型的安全任务自我批评,使用两种系统提示来学习不同的行为;二是来自`truthy-dpo`数据集,用于增强模型的真实性,使用两种类型的系统提示。数据集包含以下字段:`system`(系统提示)、`prompt`(用户提示)、`chosen`(首选答案)、`rejected`(非首选答案)。为了使用`trl`库进行微调,您需要使用一个允许系统提示的模型,或者将`system`和`prompt`字段连接成一个字段。
提供机构:
vicgalle
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Configurable System Prompt Multi-task Dataset
  • 特征:
    • system: 系统提示,字符串类型
    • prompt: 用户提示,字符串类型
    • chosen: 首选答案,字符串类型
    • rejected: 非首选答案,字符串类型
    • task: 任务描述,字符串类型
  • 分割:
    • train: 1952个样本,总大小3747667字节
  • 下载大小: 2087335字节
  • 数据集大小: 3747667字节
  • 许可证: cc-by-4.0

任务与语言

  • 任务类别: 文本生成
  • 语言: 英语

标签与大小分类

  • 标签:
    • 安全
    • 系统提示
    • 合成
    • dpo
  • 大小分类: 1K<n<10K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作