维基百科-中文
收藏OpenDataLab2026-06-07 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/ABear/Wiki_CN
下载链接
链接失效反馈官方服务:
资源简介:
wiki-cn数据集是一个基于中文维基百科网站的大规模文本数据集。维基百科是一个包含了大量开放式、多语言的在线百科全书,它的内容覆盖了各个领域的知识。
The wiki-cn dataset is a large-scale text dataset based on the Chinese Wikipedia website. Wikipedia is a large open, multilingual online encyclopedia that covers knowledge across all fields.
提供机构:
ABear
创建时间:
2023-07-20
搜集汇总
数据集介绍

背景与挑战
背景概述
维基百科-中文数据集是一个基于中文维基百科的大规模文本数据集,包含2.03GB数据和超过130万条条目,适用于自然语言处理任务和知识研究。数据集由OpenDataLab发布,采用开放许可证,为研究人员和开发者提供了丰富的中文文本资源。
以上内容由遇见数据集搜集并总结生成



