拟人数据集 Human-Like-DPO-Dataset

Name: 拟人数据集 Human-Like-DPO-Dataset
Creator: maas
Published: 2026-05-23 23:51:00
License: 暂无描述

魔搭社区2026-05-23 更新2025-01-18 收录

下载链接：

https://modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

# 本数据集论文解读，请看公众号文章 👇🏻 ### <img src="https://www.modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset/resolve/master/wechat.png" width="30" height="30" align="absmiddle"> 觉察流 - [AI的“人味儿”从何而来？DPO和LoRA打造更拟人化的AI](https://mp.weixin.qq.com/s/59WEBKi0uGYCwOXsd5FgCw) <br/> # 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} > <span style="color:red;font-size:16px"> 声明：本数据集完全转载自 Huggingface 上的 [HumanLLMs/Human-Like-DPO-Dataset](https://huggingface.co/HumanLLMs/Human-Like-DPO-Dataset) <br/>更多模型信息，请关注下文👇🏻，为原数据集仓库的中文版说明。</span> <br/> #### _仓库作者在此 👇🏻 扫一扫_ <img src="https://www.modelscope.cn/models/okwinds/GPT-2/resolve/master/qrcode_for_jcl_258.jpg" /> _______________________________ <br/> <br/> <div align="center"> <img src="https://www.modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset/resolve/master/avatar.jpeg" width="320" height="320" /> <h1>提升大型语言模型中的拟人化响应</h1> </div> <p align="center"> &nbsp&nbsp | 🤖 <a href="https://www.modelscope.cn/collections/Human-Like-nirenyingda-38b077cf6d0a44">模型集合</a>&nbsp&nbsp | &nbsp&nbsp 📊 <a href="https://www.modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset">数据集</a>&nbsp&nbsp | &nbsp&nbsp <img src="https://www.modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset/resolve/master/wechat.png" width="22" height="22" align="absmiddle"> <a href="https://mp.weixin.qq.com/s/59WEBKi0uGYCwOXsd5FgCw">论文解读</a>&nbsp&nbsp | &nbsp&nbsp 📄<a href="https://arxiv.org/abs/2501.05032">论文</a>&nbsp&nbsp | </p> # **Human-Like-DPO-Dataset** 此数据集是作为旨在提高大型语言模型对话流畅度和参与度研究的一部分创建的。它适用于直接偏好优化（DPO）等格式，以引导模型生成更符合人类语言风格的响应。本数据集包含 **256 主题** 中的 **10,884 样本**，囊括了: - 技术 - 日常生活 - 科学 - 历史 - 艺术每个样本包含： - **对话问题**: 自然、吸引人的问题，反映日常人类对话。 - **拟人回应**: 生成自然、对话式的答案，以模仿人类互动。 - **正式回复**: 反映传统人工智能响应的结构化、专业回答。 # **数据集用途** 此数据集可用于微调LLM： - 提高对话连贯性。 - 减少机械或非个性化响应。 - 提升对话系统的情商。更多关于数据集创建和使用的详细信息可以在随附的研究论文中找到。 <img src="https://www.modelscope.cn/datasets/okwinds/Human-Like-DPO-Dataset/resolve/master/wechat.png" width="22" height="22" align="absmiddle"> [论文解读](https://mp.weixin.qq.com/s/59WEBKi0uGYCwOXsd5FgCw) | 📄[研究论文](https://arxiv.org/abs/2501.05032).

<div align="center"> <img src="https://cdn-avatars.huggingface.co/v1/production/uploads/63da3d7ae697e5898cb86854/H-vpXOX6KZu01HnV87Jk5.jpeg" width="320" height="320" /> <h1>提升大语言模型的类人回复能力</h1> </div> <p align="center"> 🤗 <a href="https://huggingface.co/collections/HumanLLMs">模型</a> | 📊 <a href="https://huggingface.co/datasets/HumanLLMs/Human-Like-DPO-Dataset">数据集</a> | 📄 <a href="https://arxiv.org/abs/2501.05032">研究论文</a> </p> # **类人DPO数据集（Human-Like-DPO-Dataset）** 本数据集为提升大语言模型（Large Language Models）对话流畅性与交互吸引力的研究成果之一，适用于**直接偏好优化（Direct Preference Optimization，DPO）**等训练范式，可引导模型生成更具类人特质的回复。本数据集共包含**10884条样本**，覆盖**256个主题**，涵盖以下类别： - 科技领域 - 日常生活领域 - 科学领域 - 历史领域 - 艺术领域每条样本均包含以下内容： - **对话式问题**：贴合日常人类对话场景的自然、生动的问题。 - **类人回复**：模拟人类交互模式生成的自然对话式答案。 - **标准式回复**：体现传统AI回复风格的结构化、专业化答案。 # **数据集使用场景** 本数据集可用于对大语言模型进行微调，以实现以下目标： - 提升对话连贯性 - 减少机械生硬、缺乏人情味的回复 - 提升对话系统的情感智能有关数据集构建与使用的更多细节，可参阅配套<a href="https://arxiv.org/abs/2501.05032">研究论文</a>。

提供机构：

maas

创建时间：

2025-01-19

搜集汇总

数据集介绍