DPO-zh-en-emoji 表情符号问答数据集
收藏超神经2024-08-08 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/33229
下载链接
链接失效反馈官方服务:
资源简介:
DPO-zh-en-emoji 数据集是 shareAI 于 2024 年推出的一个特别设计用于微调大型语言模型的数据集,其中「DPO」代表直接偏好优化 (Direct Preference Optimization) 。这个数据集包含了大量的问答对数据,每个问题都有中文和英文两个版本的答案,并且答案中融入了趣味幽默的元素,包括表情符号 (emoji) 的使用。研究团队精心选出了一些源于知乎、逻辑推理、弱智吧的问题作为 query,使用 llama3 70b instruct 模型采样生成,对每个 query 生成一个中文版本的 answer 和一个英文版本的 answer 。这样的设计有助于激活多语言聊天模型的语言风格偏好,提升模型生成内容的质量和对人类偏好的符合度。
The DPO-zh-en-emoji dataset is a specially designed dataset for fine-tuning large language models, launched by shareAI in 2024. Here, "DPO" is an abbreviation for Direct Preference Optimization. This dataset comprises a large corpus of question-answer pairs, where each query is equipped with both Chinese and English responses that integrate playful and humorous elements, including the use of emojis. The research team carefully curated queries sourced from Zhihu, logical reasoning topics, and Zhuo Ba Ba (a Chinese internet humor forum), then generated responses via sampling using the Llama3 70B Instruct model, producing one Chinese answer and one English answer for each individual query. This design facilitates activating the language style preferences of multilingual chat models, thereby enhancing the quality of model-generated content and its alignment with human preferences.
创建时间:
2024-08-06
搜集汇总
数据集介绍

背景与挑战
背景概述
DPO-zh-en-emoji数据集是一个专门用于微调大型语言模型的问答数据集,由shareAI于2024年推出。它包含大量中文和英文双语答案的问答对,答案中融入了趣味幽默元素和表情符号,旨在激活多语言模型的语言风格偏好,提升生成内容的质量和对人类偏好的符合度。
以上内容由遇见数据集搜集并总结生成



