five

flammenai/FlameMix-DPO-v1

收藏
Hugging Face2024-08-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/flammenai/FlameMix-DPO-v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个混合的DPO(Direct Preference Optimization)集合,旨在生成一个能够进行有趣、类似人类对话的无审查大型语言模型(LLM)。数据集包含了多个子集,如Date-DPO-v1、Date-DPO-v2、Date-DPO-v3、Prude-Phi3-DPO和casual-conversation-DPO,这些子集分别基于不同的模型和数据集生成。每个样本都添加了系统消息,并且所有列都标准化为`system`、`prompt`、`chosen`、`rejected`。

该数据集是一个混合的DPO(Direct Preference Optimization)集合,旨在生成一个能够进行有趣、类似人类对话的无审查大型语言模型(LLM)。数据集包含了多个子集,如Date-DPO-v1、Date-DPO-v2、Date-DPO-v3、Prude-Phi3-DPO和casual-conversation-DPO,这些子集分别基于不同的模型和数据集生成。每个样本都添加了系统消息,并且所有列都标准化为`system`、`prompt`、`chosen`、`rejected`。
提供机构:
flammenai
原始信息汇总

数据集概述

数据集内容

  • flammenai/Date-DPO-v1, flammenai/Date-DPO-v2, and flammenai/Date-DPO-v3 - 包含Q&A Flammen-Mistral与one-shot ChatGPT 3.5的对比数据。
  • flammenai/Prude-Phi3-DPO - 使用ResplendentAI/NSFW_RP_Format_NoQuote格式,包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。
  • flammenai/casual-conversation-DPO - 基于SohamGhadge/casual-conversation,包含由microsoft/Phi-3-mini-4k-instruct-gguf生成的拒绝响应。

数据集结构

  • 所有样本均添加了系统消息。
  • 所有列均标准化为system, prompt, chosen, rejected

数据集特性

  • 旨在生成不受审查的LLM,能够进行有趣、类似人类的对话。
  • 标记为not-for-all-audiences,可能包含不适宜所有观众的内容。

许可证

  • 遵循Apache-2.0许可证。

语言

  • 英语。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作