wikipedia-20251101
收藏魔搭社区2025-12-04 更新2025-11-22 收录
下载链接:
https://modelscope.cn/datasets/NeuML/wikipedia-20251101
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Card for Wikipedia English November 2025
Dataset created using this [repo](https://huggingface.co/datasets/NeuML/wikipedia) with a [November 2025 Wikipedia snapshot](https://dumps.wikimedia.org/enwiki/20251101/).
This repo also has a precomputed pageviews database. This database has the aggregated number of views for each page in Wikipedia. This file is built using the Wikipedia [Pageview complete dumps](https://dumps.wikimedia.org/other/pageview_complete/readme.html)
# 维基百科英文2025年11月版数据集卡片
本数据集基于该[代码仓库](https://huggingface.co/datasets/NeuML/wikipedia)构建,采用了[2025年11月维基百科快照](https://dumps.wikimedia.org/enwiki/20251101/)数据。
本代码仓库同时附带预计算完成的页面访问量数据库,该数据库汇总了维基百科各页面的累计访问次数。本文件基于维基百科[完整页面访问量转储文件](https://dumps.wikimedia.org/other/pageview_complete/readme.html)构建。
提供机构:
maas
创建时间:
2025-11-18



