flammenai/FlameMix-DPO-v1

Name: flammenai/FlameMix-DPO-v1
Creator: flammenai
Published: 2024-08-01 11:42:47
License: 暂无描述

Hugging Face2024-08-01 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/flammenai/FlameMix-DPO-v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个混合的DPO（Direct Preference Optimization）集合，旨在生成一个能够进行有趣、类似人类对话的无审查大型语言模型（LLM）。数据集包含了多个子集，如Date-DPO-v1、Date-DPO-v2、Date-DPO-v3、Prude-Phi3-DPO和casual-conversation-DPO，这些子集分别基于不同的模型和数据集生成。每个样本都添加了系统消息，并且所有列都标准化为`system`、`prompt`、`chosen`、`rejected`。

提供机构：

flammenai

原始信息汇总

数据集概述

数据集内容

flammenai/Date-DPO-v1, flammenai/Date-DPO-v2, and flammenai/Date-DPO-v3 - 包含Q&A Flammen-Mistral与one-shot ChatGPT 3.5的对比数据。
flammenai/Prude-Phi3-DPO - 使用ResplendentAI/NSFW_RP_Format_NoQuote格式，包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。
flammenai/casual-conversation-DPO - 基于SohamGhadge/casual-conversation，包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。

数据集结构

所有样本均添加了系统消息。
所有列均标准化为system, prompt, chosen, rejected。

数据集特性

旨在生成不受审查的LLM，能够进行有趣、类似人类的对话。
标记为not-for-all-audiences，可能包含不适宜所有观众的内容。

许可证

遵循Apache-2.0许可证。

语言

英语。

5,000+

优质数据集

54 个

任务类型

进入经典数据集