shareAI-Llama3 中文化偏好数据集

Name: shareAI-Llama3 中文化偏好数据集
Creator: maas
Published: 2026-05-19 19:42:10
License: 暂无描述

魔搭社区2026-05-19 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/shareAI/shareAI-Llama3-DPO-zh-en-emoji

下载链接

链接失效反馈

官方服务：

资源简介：

shareAI-Llama3 中文化偏好数据集 (也可以反向用于训练英文）

shareAI-Llama3 Chinese Preference Dataset, which can also be used in reverse for English training

提供机构：

maas

创建时间：

2024-05-05

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是一个用于Llama3模型中文偏好对齐的DPO数据集，旨在通过对比中文和英文答案来优化模型的中文语言能力。数据来源于知乎、逻辑推理和弱智吧的问题，由Llama3 70b instruct模型生成配对答案，训练过程高效，仅需约10分钟即可显著提升中文表现。

以上内容由遇见数据集搜集并总结生成