five

masaki-sakata/entity_popularity

收藏
Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/masaki-sakata/entity_popularity
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览次数。年度文章浏览次数被视为实体流行度的指标。每个数据集行包含wiki_title、popularity和qid属性,其中popularity值是通过2021年维基百科API获得的相应wiki_title文章的年度页面浏览量。数据集为英文,遵循MIT许可证。

该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览次数。年度文章浏览次数被视为实体流行度的指标。每个数据集行包含wiki_title、popularity和qid属性,其中popularity值是通过2021年维基百科API获得的相应wiki_title文章的年度页面浏览量。数据集为英文,遵循MIT许可证。
提供机构:
masaki-sakata
原始信息汇总

实体流行度数据集

数据集概述

该数据集包含约26,000个实体的信息,包括维基百科文章标题、QID和2021年的年度文章浏览量。年度文章浏览量可视为实体流行度的指标。

语言

该数据集仅包含英文数据。

数据集结构

数据集包含以下特征:

  • wiki_title: 维基百科页面标题,数据类型为字符串。
  • popularity: 流行度分数,表示维基百科文章的年度浏览量,数据类型为整数。
  • qid: 维基数据中项目的唯一标识符,数据类型为字符串。

数据集分为一个名为en的拆分,包含26,270个样本,总大小为1,049,005字节。

示例

以下是数据集中的一个示例条目: json {"wiki_title":"FC Barcelona","popularity":5389420.0,"qid":"Q7156"}

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作