moss-003-sft-data
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/suntianxiang/moss-003-sft-data
下载链接
链接失效反馈官方服务:
资源简介:
moss-moon-003-sft所使用的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入数据并构造而成,相比之下,gpt-3.5-turbo更加moss-002-sft-data符合
The multi-turn dialogue data utilized by moss-moon-003-sft was constructed based on approximately 100,000 pieces of user input data collected during the internal testing phase of MOSS-002. In comparison, gpt-3.5-turbo is more consistent with moss-002-sft-data
提供机构:
suntianxiang
创建时间:
2023-10-13
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是用于训练'moss-moon-003-sft'模型的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入构造而成,专注于文本微调和文本生成任务。数据集大小为2.9GB,包含18.8k个实例,采用CC BY 4.0开源许可,由复旦大学于2023年4月19日发布,适用于对话系统开发和自然语言处理研究。
以上内容由遇见数据集搜集并总结生成



