flammenai/FlameMix-DPO-v1
收藏Hugging Face2024-08-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/flammenai/FlameMix-DPO-v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个混合的DPO(Direct Preference Optimization)集合,旨在生成一个能够进行有趣、类似人类对话的无审查大型语言模型(LLM)。数据集包含了多个子集,如Date-DPO-v1、Date-DPO-v2、Date-DPO-v3、Prude-Phi3-DPO和casual-conversation-DPO,这些子集分别基于不同的模型和数据集生成。每个样本都添加了系统消息,并且所有列都标准化为`system`、`prompt`、`chosen`、`rejected`。
该数据集是一个混合的DPO(Direct Preference Optimization)集合,旨在生成一个能够进行有趣、类似人类对话的无审查大型语言模型(LLM)。数据集包含了多个子集,如Date-DPO-v1、Date-DPO-v2、Date-DPO-v3、Prude-Phi3-DPO和casual-conversation-DPO,这些子集分别基于不同的模型和数据集生成。每个样本都添加了系统消息,并且所有列都标准化为`system`、`prompt`、`chosen`、`rejected`。
提供机构:
flammenai
原始信息汇总
数据集概述
数据集内容
- flammenai/Date-DPO-v1, flammenai/Date-DPO-v2, and flammenai/Date-DPO-v3 - 包含Q&A Flammen-Mistral与one-shot ChatGPT 3.5的对比数据。
- flammenai/Prude-Phi3-DPO - 使用ResplendentAI/NSFW_RP_Format_NoQuote格式,包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。
- flammenai/casual-conversation-DPO - 基于SohamGhadge/casual-conversation,包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。
数据集结构
- 所有样本均添加了系统消息。
- 所有列均标准化为
system,prompt,chosen,rejected。
数据集特性
- 旨在生成不受审查的LLM,能够进行有趣、类似人类的对话。
- 标记为
not-for-all-audiences,可能包含不适宜所有观众的内容。
许可证
- 遵循Apache-2.0许可证。
语言
- 英语。



