WikiEvents Dataset from January 2020 to December 2022
收藏DataCite Commons2023-12-29 更新2025-04-16 收录
下载链接:
https://www.fdr.uni-hamburg.de/record/11446
下载链接
链接失效反馈官方服务:
资源简介:
WikiEvents is a knowledge graph based dataset for NLP and event-related machine learning tasks.
This dataset includes RDF data in JSON-LD about events between January 2020 and December 2022. It was extracted from the Wikipedia Current events portal, Wikidata, OpenStreetMaps Nominatim and Falcon 2.0. The extractor is available on GitHub under semantic-systems/current-events-to-kg.
The RDF data for each month is split onto four graph modules each:
The <strong>base</strong> graph module contains events, event summaries with references from named entities to Wikipedia articles.
The <strong>ohg</strong> graph module with all one-hop graphs (ohg) around the referencend Wikidata entities.
The <strong>osm</strong> graph module which contains spartial data from OpenStreetMap (OSM).
The <strong>raw</strong> graph module containing the raw HTML objects of events and article infoboxes.
This repository additionally includes two JSON files with training samples used for entity linking and event-related location extraction. They were created using queries to the WikiEvents dataset uploaded into this repository.
WikiEvents是一款面向自然语言处理(Natural Language Processing,简称NLP)与事件相关机器学习任务的知识图谱数据集。
本数据集包含2020年1月至2022年12月期间各类事件的JSON-LD格式资源描述框架(Resource Description Framework,简称RDF)数据,其数据源涵盖维基百科时事门户、维基数据(Wikidata)、开放街道地图Nominatim(OpenStreetMaps Nominatim)以及Falcon 2.0。该数据集的提取工具托管于GitHub平台的semantic-systems/current-events-to-kg仓库中。
每月对应的RDF数据均被划分为四个图谱模块:
**基础(base)**图谱模块:收录事件及事件摘要,附带从命名实体指向维基百科条目的参考文献。
**单跳图(one-hop graphs,简称ohg)**图谱模块:收录所有围绕已引用维基数据实体的单跳关系图。
**osm**图谱模块:收录来自开放街道地图(OpenStreetMap,简称OSM)的空间数据。
**raw**图谱模块:包含事件与条目信息框的原始HTML对象。
本仓库还附带两个JSON文件,内含用于实体链接与事件相关位置抽取任务的训练样本,这些样本通过查询上传至本仓库的WikiEvents数据集生成。
提供机构:
Universität Hamburg
创建时间:
2023-02-07
搜集汇总
数据集介绍

背景与挑战
背景概述
WikiEvents Dataset是一个基于知识图谱的数据集,涵盖2020年1月至2022年12月的事件数据,适用于NLP和事件相关的机器学习任务。数据集以RDF格式存储,分为四个图模块,并包含额外的训练样本文件,支持实体链接和位置提取任务。
以上内容由遇见数据集搜集并总结生成



