aifeifei798/DPO_Pairs-Roleplay-NSFW
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/aifeifei798/DPO_Pairs-Roleplay-NSFW
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约3.4k个DPO对,主要由Iambe模型生成,部分由GPT-4生成。数据集主要用于ERP(企业资源规划),但也包含其他类型的内容如运动和冒险。数据集未经手动清理,存在一些问题和弱点,但上传者认为其仍有训练模型的价值。
The dataset contains approximately 3.4k pairs of DPO (Direct Preference Optimization) pairs, primarily generated by Iambe, mixed with GPT-4 and other Iambe models. These pairs are generated simultaneously for accepted and rejected responses through a two-part prompt. The dataset is mainly intended for ERP (Emotional Role Play), containing a large portion of erotic scenarios, but also includes sports, adventure, etc. to provide a baseline. The dataset has not been manually cleaned, primarily processed through search and replace. The goal is to create a better Iambe model to generate higher quality data.
提供机构:
aifeifei798
原始信息汇总
数据集概述
描述
- 数据集名称: DPO_Pairs-Roleplay-Alpaca-NSFW
- 数据量: 约3.4k对DPO(Direct Preference Optimization)数据
- 生成方式:
- 主要由Iambe模型生成(约80%),结合GPT-4(约10%)
- 生成参数:温度1.2,最小概率0.15
- 每个数据对包含一个被选择的响应和一个被拒绝的响应
- 内容类型:
- 主要用于角色扮演(ERP),包含大量情色场景
- 也包含体育、冒险等非情色内容
缺点与弱点
- 未完全人工清理: 仅进行了基本的查找替换
- 内容质量: 部分数据未经过人工审核,存在一些不合适的内容
- 响应质量: 有些被选择的响应中,AI代表用户发言,已移除部分,但仍需手动过滤
目标
- 数据集用途: 用于训练更好的Iambe模型,以生成更高质量的数据
- 未来计划: 计划结合更多模型的生成数据,以避免仅放大Iambe的信号
额外信息
- 训练笔记: 提供了用于训练athirdpath/Iambe-20b-v3_TEST-RP_cDPO模型的笔记本,基于Kaggle上的一个项目改编



