athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW
收藏Hugging Face2023-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约3.4k个DPO对,由Iambe模型结合GPT-4生成(约10% GPT-4,约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k),温度为1.2,最小概率为0.15。数据集主要用于ERP(企业资源规划),其中包含大量的情色场景,但也有体育、冒险等内容作为基线。数据集未经手动清理,部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型,使其能够生成更高质量的数据。
该数据集包含约3.4k个DPO对,由Iambe模型结合GPT-4生成(约10% GPT-4,约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k),温度为1.2,最小概率为0.15。数据集主要用于ERP(企业资源规划),其中包含大量的情色场景,但也有体育、冒险等内容作为基线。数据集未经手动清理,部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型,使其能够生成更高质量的数据。
提供机构:
athirdpath
原始信息汇总
数据集概述
数据集内容
- 包含约3.4k个DPO(数据处理对象)对。
- 数据生成主要由Iambe模型(约80%)和GPT-4模型(约10%)共同完成,剩余10%由Iambe在不同参数下生成。
- 生成参数包括温度1.2和最小概率0.15。
- 数据集中大部分内容涉及ERP(企业资源计划),包括大量情色场景,同时也有体育、冒险等其他内容。
数据集特点
- 每个DPO对的选择和拒绝响应同时生成,少数失败案例中拒绝响应由标准AI拒绝模板填充。
- 数据集未经过详细手动清洗,主要进行了基本的搜索和替换操作。
- 部分内容未经人工阅读,存在AI代理用户行为的情况,已尽力移除可见部分。
数据集目标
- 旨在用于训练改进Iambe模型,以生成更高质量的数据。
- 计划结合更多模型的数据,以避免仅放大Iambe的现有信号。
附加信息
- 提供了用于训练Iambe模型的笔记本,该笔记本基于Kaggle的资源并进行了适应性修改。



