five

llama3中文化数据集|自然语言处理数据集|中文语言模型数据集

收藏
库帕思2025-12-05 更新2025-12-20 收录
下载链接:
https://www.kupasai.com/corpus/detail?id=479&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
<p>该数据集为Llama3中文化数据集合,已统一处理为Firefly格式,便于直接用于训练中文大模型。数据集包含约320万条高质量中文对话样本,涵盖多领域问答、闲聊、任务导向等场景,语言风格多样且贴近真实用户表达。适用于提升Llama3在中文语境下的理解与生成能力,可广泛应用于智能客服、内容创作、对话系统等场景。配合Firefly工具链使用,支持快速微调与部署。</p>
提供机构:
库帕思
创建时间:
2025-10-27
二维码
社区交流群
二维码
科研交流群
商业服务