M1keR/finewiki-sv
收藏Hugging Face2025-10-22 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/M1keR/finewiki-sv
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从维基百科抓取的页面数据,其中包括页面文本、标题、URL、修改日期、语言等信息。每个页面都标记有是否包含数学公式,并且提供了维基数据ID和HTML大小等元数据。数据集被划分为训练集,适用于自然语言处理等任务。
This dataset consists of Wikipedia page data, including page text, title, URL, modification date, language, and other information. Each page is tagged with whether it contains mathematical formulas, and metadata such as Wikidata ID and HTML size are provided. The dataset is split into a training set, suitable for natural language processing and other tasks.
提供机构:
M1keR



