five

moss-003-sft-data

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/suntianxiang/moss-003-sft-data
下载链接
链接失效反馈
官方服务:
资源简介:
moss-moon-003-sft所使用的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入数据并构造而成,相比之下,gpt-3.5-turbo更加moss-002-sft-data符合

The multi-turn dialogue data utilized by moss-moon-003-sft was constructed based on approximately 100,000 pieces of user input data collected during the internal testing phase of MOSS-002. In comparison, gpt-3.5-turbo is more consistent with moss-002-sft-data
提供机构:
suntianxiang
创建时间:
2023-10-13
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是用于训练'moss-moon-003-sft'模型的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入构造而成,专注于文本微调和文本生成任务。数据集大小为2.9GB,包含18.8k个实例,采用CC BY 4.0开源许可,由复旦大学于2023年4月19日发布,适用于对话系统开发和自然语言处理研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作