five

Wikipedia Articles Link Prediction Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/Tam1032/DSAA2023-Challenge-Link-prediction-DS-UIT_SAT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个平衡性良好的数据集,用于根据从文本中提取的词性标注(POS tag)特征来预测维基百科文章之间的链接。该数据集在评估时采用了F1分数,并且公共测试集和私有测试集在数据分布上存在差异。规模方面,数据集分为公共测试集和私有测试集两部分,所涉及的任务是链接预测。

This is a well-balanced dataset intended for predicting hyperlinks between Wikipedia articles, based on part-of-speech (POS tag) features extracted from text. F1-score is employed as the evaluation metric for this dataset, and there are disparities in data distribution between the public test set and the private test set. In terms of its structure, it is split into two subsets: the public test set and the private test set, and the underlying task is link prediction.
提供机构:
DSAA 2023 Challenge
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作