aifeifei798/DPO_Pairs-Roleplay-NSFW

Name: aifeifei798/DPO_Pairs-Roleplay-NSFW
Creator: aifeifei798
Published: 2024-07-21 15:19:25
License: 暂无描述

Hugging Face2024-07-21 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/aifeifei798/DPO_Pairs-Roleplay-NSFW

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含约3.4k个DPO对，主要由Iambe模型生成，部分由GPT-4生成。数据集主要用于ERP（企业资源规划），但也包含其他类型的内容如运动和冒险。数据集未经手动清理，存在一些问题和弱点，但上传者认为其仍有训练模型的价值。

The dataset contains approximately 3.4k pairs of DPO (Direct Preference Optimization) pairs, primarily generated by Iambe, mixed with GPT-4 and other Iambe models. These pairs are generated simultaneously for accepted and rejected responses through a two-part prompt. The dataset is mainly intended for ERP (Emotional Role Play), containing a large portion of erotic scenarios, but also includes sports, adventure, etc. to provide a baseline. The dataset has not been manually cleaned, primarily processed through search and replace. The goal is to create a better Iambe model to generate higher quality data.

提供机构：

aifeifei798

原始信息汇总

数据集概述

描述

数据集名称: DPO_Pairs-Roleplay-Alpaca-NSFW
数据量: 约3.4k对DPO（Direct Preference Optimization）数据
生成方式:
- 主要由Iambe模型生成（约80%），结合GPT-4（约10%）
- 生成参数：温度1.2，最小概率0.15
- 每个数据对包含一个被选择的响应和一个被拒绝的响应
内容类型:
- 主要用于角色扮演（ERP），包含大量情色场景
- 也包含体育、冒险等非情色内容

缺点与弱点

未完全人工清理: 仅进行了基本的查找替换
内容质量: 部分数据未经过人工审核，存在一些不合适的内容
响应质量: 有些被选择的响应中，AI代表用户发言，已移除部分，但仍需手动过滤

目标

数据集用途: 用于训练更好的Iambe模型，以生成更高质量的数据
未来计划: 计划结合更多模型的生成数据，以避免仅放大Iambe的信号

额外信息

训练笔记: 提供了用于训练athirdpath/Iambe-20b-v3_TEST-RP_cDPO模型的笔记本，基于Kaggle上的一个项目改编

5,000+

优质数据集

54 个

任务类型

进入经典数据集