MultiAlpaca多语言指令精调数据集
收藏魔搭社区2026-05-19 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/iic/nlp_polylm_multialpaca_sft
下载链接
链接失效反馈官方服务:
资源简介:
MultiAlpaca数据集是根据self-instruct思想构建的多语言指令精调数据集
The MultiAlpaca Dataset is a multilingual instruction fine-tuning dataset constructed based on the self-instruct framework.
提供机构:
maas
创建时间:
2023-07-28
搜集汇总
数据集介绍

背景与挑战
背景概述
MultiAlpaca是一个基于自指导方法构建的多语言指令精调数据集,涵盖11种语言,包含约13.27万条数据条目,用于大语言模型的监督微调。数据以JSONLines格式存储,每个样本包括指令、输入和输出字段,支持多语言SFT任务。
以上内容由遇见数据集搜集并总结生成



