five

出门问问序列猴子开源数据集

收藏
魔搭社区2026-05-30 更新2024-09-14 收录
下载链接:
https://modelscope.cn/datasets/ddzhu123/seq-monkey
下载链接
链接失效反馈
官方服务:
资源简介:
数据集名称: seq-monkey 序列猴子开源数据集 1.0,原始发布地址: https://github.com/mobvoi/seq-monkey-data

数据集名称:seq-monkey(序列猴子)开源数据集1.0,原始发布地址:https://github.com/mobvoi/seq-monkey-data
提供机构:
maas
创建时间:
2024-09-13
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
出门问问序列猴子开源数据集是由Mobvoi(出门问问)发布的用于训练Sequence Monkey语言模型的数据集,包含通用中文文本、古现代诗歌翻译和文本生成三个领域的语料。具体包括1300万条通用中文文本、68万首诗歌翻译和5000个问答对,适用于词错误检测、纠正和文本润色等自然语言处理任务。数据集大小为11.52GB,采用Apache License 2.0许可证,更新于2024年9月13日。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务