geoskyr/finewiki-greek-filtered
收藏Hugging Face2025-11-11 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/geoskyr/finewiki-greek-filtered
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从维基百科抓取的页面数据,每个页面包括文本内容、ID、维基名称、页面ID、标题、URL、修改日期、语言、维基数据ID、HTML大小、维基文本、版本、信息框以及是否含有数学公式等信息。数据集分为训练集,提供了相应的大小和示例数量。数据集适用于自然语言处理、信息检索和知识图谱等领域的研究。
This dataset consists of Wikipedia page data, including each pages text content, ID, Wikipedia name, page ID, title, URL, modification date, language, Wikidata ID, HTML size, wikitext, version, infoboxes, and whether it contains mathematical formulas. The dataset is split into a training set, with the corresponding size and number of examples provided. It is suitable for research in natural language processing, information retrieval, and knowledge graphs.
提供机构:
geoskyr



