Everything_Instruct_Multilingual
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/Everything_Instruct_Multilingual
下载链接
链接失效反馈官方服务:
资源简介:
Everything Instruct (Multilingual Edition) 旨在为开源AI的大语言模型带来提升,它是一个大型的Alpaca指令格式数据集,涵盖广泛的主题。该数据集包含7,800,783行数据,最大长度为78,451个token,支持包括英语、俄语、中文、韩语、乌尔都语、拉丁语、阿拉伯语、德语、西班牙语、法语、印地语、意大利语、日语、荷兰语和葡萄牙语在内的多种语言。数据内容涵盖科学、社交媒体、常识、多语言翻译、烹饪、写作、医学、历史、法律、角色扮演、新闻、编程、数学、函数调用和通用指令等多个领域,数据来源于多个公开数据集。该数据集采用Apache-2.0授权许可。
创建时间:
2024-07-19



