wikipedia-20240101
收藏魔搭社区2025-11-27 更新2025-01-11 收录
下载链接:
https://modelscope.cn/datasets/NeuML/wikipedia-20240101
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Card for Wikipedia English January 2024
Dataset created using this [repo](https://huggingface.co/datasets/NeuML/wikipedia) with a January 2024 Wikipedia snapshot.
This repo also has a precomputed pageviews database. This database has the aggregated number of views for each page in Wikipedia. This file is built using the Wikipedia [Pageview complete dumps](https://dumps.wikimedia.org/other/pageview_complete/readme.html)
# 2024年1月英文维基百科数据集卡片(Dataset Card)
本数据集基于此[仓库](https://huggingface.co/datasets/NeuML/wikipedia)构建,采用2024年1月的维基百科快照。
该仓库同时提供预计算的页面访问量数据库,该数据库收录了维基百科各页面的累计访问量。此文件依托维基百科的[完整页面访问量转储文件(Pageview complete dumps)](https://dumps.wikimedia.org/other/pageview_complete/readme.html)生成。
提供机构:
maas
创建时间:
2025-01-06



