five

aifeifei798/DPO_Pairs-Roleplay-NSFW

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/aifeifei798/DPO_Pairs-Roleplay-NSFW
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约3.4k个DPO对,主要由Iambe模型生成,部分由GPT-4生成。数据集主要用于ERP(企业资源规划),但也包含其他类型的内容如运动和冒险。数据集未经手动清理,存在一些问题和弱点,但上传者认为其仍有训练模型的价值。

The dataset contains approximately 3.4k pairs of DPO (Direct Preference Optimization) pairs, primarily generated by Iambe, mixed with GPT-4 and other Iambe models. These pairs are generated simultaneously for accepted and rejected responses through a two-part prompt. The dataset is mainly intended for ERP (Emotional Role Play), containing a large portion of erotic scenarios, but also includes sports, adventure, etc. to provide a baseline. The dataset has not been manually cleaned, primarily processed through search and replace. The goal is to create a better Iambe model to generate higher quality data.
提供机构:
aifeifei798
原始信息汇总

数据集概述

描述

  • 数据集名称: DPO_Pairs-Roleplay-Alpaca-NSFW
  • 数据量: 约3.4k对DPO(Direct Preference Optimization)数据
  • 生成方式:
    • 主要由Iambe模型生成(约80%),结合GPT-4(约10%)
    • 生成参数:温度1.2,最小概率0.15
    • 每个数据对包含一个被选择的响应和一个被拒绝的响应
  • 内容类型:
    • 主要用于角色扮演(ERP),包含大量情色场景
    • 也包含体育、冒险等非情色内容

缺点与弱点

  • 未完全人工清理: 仅进行了基本的查找替换
  • 内容质量: 部分数据未经过人工审核,存在一些不合适的内容
  • 响应质量: 有些被选择的响应中,AI代表用户发言,已移除部分,但仍需手动过滤

目标

  • 数据集用途: 用于训练更好的Iambe模型,以生成更高质量的数据
  • 未来计划: 计划结合更多模型的生成数据,以避免仅放大Iambe的信号

额外信息

  • 训练笔记: 提供了用于训练athirdpath/Iambe-20b-v3_TEST-RP_cDPO模型的笔记本,基于Kaggle上的一个项目改编
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作