athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW

收藏

Hugging Face2023-12-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含约3.4k个DPO对，由Iambe模型结合GPT-4生成（约10% GPT-4，约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k），温度为1.2，最小概率为0.15。数据集主要用于ERP（企业资源规划），其中包含大量的情色场景，但也有体育、冒险等内容作为基线。数据集未经手动清理，部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型，使其能够生成更高质量的数据。

该数据集包含约3.4k个DPO对，由Iambe模型结合GPT-4生成（约10% GPT-4，约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k），温度为1.2，最小概率为0.15。数据集主要用于ERP（企业资源规划），其中包含大量的情色场景，但也有体育、冒险等内容作为基线。数据集未经手动清理，部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型，使其能够生成更高质量的数据。

提供机构：

athirdpath

原始信息汇总

数据集概述

数据集内容

包含约3.4k个DPO（数据处理对象）对。
数据生成主要由Iambe模型（约80%）和GPT-4模型（约10%）共同完成，剩余10%由Iambe在不同参数下生成。
生成参数包括温度1.2和最小概率0.15。
数据集中大部分内容涉及ERP（企业资源计划），包括大量情色场景，同时也有体育、冒险等其他内容。

数据集特点

每个DPO对的选择和拒绝响应同时生成，少数失败案例中拒绝响应由标准AI拒绝模板填充。
数据集未经过详细手动清洗，主要进行了基本的搜索和替换操作。
部分内容未经人工阅读，存在AI代理用户行为的情况，已尽力移除可见部分。

数据集目标

旨在用于训练改进Iambe模型，以生成更高质量的数据。
计划结合更多模型的数据，以避免仅放大Iambe的现有信号。

附加信息

提供了用于训练Iambe模型的笔记本，该笔记本基于Kaggle的资源并进行了适应性修改。

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作