five

中国移动科普数据集

收藏
国家数据集管理服务平台2026-05-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=72ddf0cf7bb75ce46664fb05ecbe65ac
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为多领域科普类专业文本数据集,内容重点覆盖科学世界、生态环境、百科知识、生物世界、宇宙知识等多个核心科普类别,来自多领域科普读物和刊物。适合用于科普领域大语言模型训练、科普知识库构建、智能科普问答系统开发、科普内容智能生成、科普文本分类检索及科普内容合规审核。

This dataset is a professional multi-domain popular science text dataset. Its content primarily covers core popular science categories including the Scientific World, Ecological Environment, Encyclopedic Knowledge, Biological World, and Cosmic Knowledge, and it is sourced from multi-domain popular science books and periodicals. It is applicable for training large language models (LLMs) in the popular science domain, constructing popular science knowledge bases, developing intelligent popular science question answering systems, intelligently generating popular science content, performing classification and retrieval of popular science texts, and conducting compliance audits for popular science content.
提供机构:
中移九天人工智能科技(北京)有限公司
创建时间:
2026-04-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个多领域科普文本数据集,涵盖科学世界、生态环境、百科知识、生物世界和宇宙知识等核心类别,规模为226GB,数据格式为JSON。它适用于科普大模型训练、知识库构建、智能问答系统开发、内容生成与分类检索等应用场景。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务