five

Wikipedia 维基百科数据集

收藏
超神经2024-02-23 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/28528
下载链接
链接失效反馈
官方服务:
资源简介:
维基百科数据集包含所有语言的已清理文章。

The Wikipedia Dataset comprises cleaned articles in all languages.
创建时间:
2024-01-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是从维基百科构建的多语言文章集合,包含已清理的完整文章内容,并按语言分为不同子集。其规模为57.98 GB,采用CC BY-NC-SA 3.0许可证。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务