Human Like DPO Dataset 大模型对话微调数据集

超神经2025-01-21 更新2025-01-18 收录

下载链接：

https://hyper.ai/cn/datasets/37132

下载链接

链接失效反馈

官方服务：

资源简介：

Human Like DPO Dataset 是一个专门设计用于提升大语言模型对话流畅性和参与度的数据集。它适用于直接偏好优化 (DPO) 等格式，旨在引导模型生成更像人类的响应。该数据集涵盖了 256 个主题，包含 10,884 个样本，这些样本分布在技术、日常生活、科学、历史和艺术等多个领域。

Human Like DPO Dataset is a specialized dataset designed to enhance the conversational fluency and engagement of large language models (LLMs). It is suitable for training formats such as Direct Preference Optimization (DPO), aiming to guide models to generate more human-like responses. This dataset covers 256 distinct topics and contains 10,884 samples distributed across multiple fields including technology, daily life, science, history, art and more.

创建时间：

2025-01-13

搜集汇总

数据集介绍

背景与挑战

背景概述

Human Like DPO Dataset 是一个用于提升大语言模型对话流畅性和参与度的数据集，包含10,884个样本，覆盖256个主题，涵盖技术、日常生活等多个领域。每个样本包含对话问题、类似人类的反应和正式回应三部分，旨在引导模型生成更自然、人性化的响应。

以上内容由遇见数据集搜集并总结生成