five

shareAI-Llama3 中文化偏好数据集|语言偏好数据集|机器学习数据集

收藏
魔搭社区2026-01-06 更新2024-05-15 收录
语言偏好
机器学习
下载链接:
https://modelscope.cn/datasets/shareAI/shareAI-Llama3-DPO-zh-en-emoji
下载链接
链接失效反馈
资源简介:
shareAI-Llama3 中文化偏好数据集 (也可以反向用于训练英文)
提供机构:
maas
创建时间:
2024-05-05
AI搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个用于Llama3模型中文偏好对齐的DPO数据集,旨在通过对比中文和英文答案来优化模型的中文语言能力。数据来源于知乎、逻辑推理和弱智吧的问题,由Llama3 70b instruct模型生成配对答案,训练过程高效,仅需约10分钟即可显著提升中文表现。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作