five

M2Lingual 多语言多轮次指令微调数据集

收藏
超神经2024-07-07 更新2024-07-06 收录
下载链接:
https://hyper.ai/cn/datasets/32724
下载链接
链接失效反馈
官方服务:
资源简介:
M2Lingual 是一个多语言、多轮次指令微调(Instruction Fine-Tuning, IFT)数据集,旨在提升大型语言模型(Large Language Models, LLMs)在遵循指令方面的性能,特别是在多样化的语言和任务上。该数据集于 2024 年由 ServiceNow 和伊利诺伊大学芝加哥分校的研究团队提出。

M2Lingual is a multilingual, multi-turn Instruction Fine-Tuning (IFT) dataset designed to improve the instruction-following performance of Large Language Models (LLMs), especially across diverse languages and tasks. This dataset was proposed by research teams from ServiceNow and the University of Illinois Chicago in 2024.
创建时间:
2024-07-03
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
M2Lingual是一个多语言、多轮次指令微调数据集,涵盖70种语言和17种自然语言处理任务,包含182,000个合成指令微调对,旨在提升大型语言模型在多语言环境下的指令遵循性能。该数据集通过进化分类法生成,增强了模型处理复杂对话场景的能力,并在评估基准上表现出优于现有数据集的性能。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务