masaki-sakata/entity_popularity
收藏Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/masaki-sakata/entity_popularity
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览次数。年度文章浏览次数被视为实体流行度的指标。每个数据集行包含wiki_title、popularity和qid属性,其中popularity值是通过2021年维基百科API获得的相应wiki_title文章的年度页面浏览量。数据集为英文,遵循MIT许可证。
该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览次数。年度文章浏览次数被视为实体流行度的指标。每个数据集行包含wiki_title、popularity和qid属性,其中popularity值是通过2021年维基百科API获得的相应wiki_title文章的年度页面浏览量。数据集为英文,遵循MIT许可证。
提供机构:
masaki-sakata
原始信息汇总
实体流行度数据集
数据集概述
该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览量。年度文章浏览量可视为实体流行度的指标。
语言
该数据集仅包含英文数据。
数据集结构
数据集包含以下特征:
wiki_title: 维基百科页面标题,数据类型为字符串。popularity: 流行度分数,表示维基百科文章的年度浏览量,数据类型为整数。qid: 维基数据中项目的唯一标识符,数据类型为字符串。
数据集分为一个名为en的拆分,包含26,270个样本,总大小为1,049,005字节。
示例
以下是数据集中的一个示例条目: json {"wiki_title":"FC Barcelona","popularity":5389420.0,"qid":"Q7156"}



