five

athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW

收藏
Hugging Face2023-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/athirdpath/DPO_Pairs-Roleplay-Alpaca-NSFW
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约3.4k个DPO对,由Iambe模型结合GPT-4生成(约10% GPT-4,约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k),温度为1.2,最小概率为0.15。数据集主要用于ERP(企业资源规划),其中包含大量的情色场景,但也有体育、冒险等内容作为基线。数据集未经手动清理,部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型,使其能够生成更高质量的数据。

该数据集包含约3.4k个DPO对,由Iambe模型结合GPT-4生成(约10% GPT-4,约80% Iambe @ q5_k_m / ~10% Iambe @ q6_k),温度为1.2,最小概率为0.15。数据集主要用于ERP(企业资源规划),其中包含大量的情色场景,但也有体育、冒险等内容作为基线。数据集未经手动清理,部分内容尚未经过人工审核。数据集的目标是用于改进Iambe模型,使其能够生成更高质量的数据。
提供机构:
athirdpath
原始信息汇总

数据集概述

数据集内容

  • 包含约3.4k个DPO(数据处理对象)对。
  • 数据生成主要由Iambe模型(约80%)和GPT-4模型(约10%)共同完成,剩余10%由Iambe在不同参数下生成。
  • 生成参数包括温度1.2和最小概率0.15。
  • 数据集中大部分内容涉及ERP(企业资源计划),包括大量情色场景,同时也有体育、冒险等其他内容。

数据集特点

  • 每个DPO对的选择和拒绝响应同时生成,少数失败案例中拒绝响应由标准AI拒绝模板填充。
  • 数据集未经过详细手动清洗,主要进行了基本的搜索和替换操作。
  • 部分内容未经人工阅读,存在AI代理用户行为的情况,已尽力移除可见部分。

数据集目标

  • 旨在用于训练改进Iambe模型,以生成更高质量的数据。
  • 计划结合更多模型的数据,以避免仅放大Iambe的现有信号。

附加信息

  • 提供了用于训练Iambe模型的笔记本,该笔记本基于Kaggle的资源并进行了适应性修改。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作