five

中国移动通用文本数据集

收藏
国家数据集管理服务平台2026-05-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=03aa4a8850fffe84b0adea08b8847894
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为高质量通用文本数据集,数据集覆盖全领域通用文本内容,文本质量规范、内容覆盖广泛。

This is a high-quality general-purpose text dataset, which covers general text content across all domains, with strictly standardized text quality and broad content coverage.
提供机构:
中移九天人工智能科技(北京)有限公司
创建时间:
2026-04-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个高质量通用文本数据集,覆盖全领域文本内容,规模达5000GB,适用于通用大语言模型预训练、增量微调、文本语义分析、智能问答及自然语言生成等多种任务。数据集由中移九天人工智能科技(北京)有限公司提供,商业使用需授权,更新于2026年5月28日。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务