linxy/ICEWS14
收藏数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 图机器学习(Graph-ML)
- 语言: 英语(en)
- 数据集大小: 1M<n<10M
数据集内容
- 构建基础: 基于ICEWS和GDELT,这两个数据集在时序知识图谱补全(TKGC)领域广泛使用。
- 首次引入: 在论文"TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph"中首次介绍。
数据集结构
-
数据加载示例: python
dataset = load_dataset("linxy/ICEWS14", "all") len(dataset["train"]) + len(dataset["validation"]) + len(dataset["test"]) 1088769
-
数据样本示例: python {query_name: Pe_aPt, definition: def Pe_aPt(e1, r1, e2, r2, e3): return Pe(e1, r1, after(Pt(e2, r2, e3))), query: [6291, 372, 5683, 283, 5264], answer: [1077], easy_answer: [], args: [e1, r1, e2, r2, e3]}
-
元数据信息: python {dataset: ICEWS14, entity_count: 7128, relation_count: 230, timestamp_count: 365, valid_triples_count: 8941, test_triples_count: 8963, train_triples_count: 72826, triple_count: 90730, query_meta: {query_name: [...], queries_count: [...], avg_answers_count: [...], ...}, entity2idx: {name: [...], id: [...]}, relation2idx: {name: [...], id: [...]}, timestamp2idx: {name: [...], id: [...]},
数据集统计
- 查询计数统计: 提供了不同查询类型在训练、验证和测试集中的数量。
- 平均答案计数统计: 提供了不同查询类型的平均答案数量。
数据集使用
- 数据加载: 支持加载完整数据集、元数据以及特定查询类型的子部分。
- 数据解码: 使用元数据中的词汇表(entity2idx, relation2idx, timestamp2idx)将查询ID解码为文本。
联系方式
- 联系人: Lin Xueyuan
- 邮箱: linxy59@mail2.sysu.edu.cn
引用信息
- 论文: TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph
- 作者: Lin Xueyuan et al.
- 会议: Thirty-seventh Conference on Neural Information Processing Systems
- 年份: 2023
- 引用格式: bibtex @inproceedings{ xueyuan2023tflex, title={TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph}, author={Lin Xueyuan and Haihong E and Chengjin Xu and Gengxian Zhou and Haoran Luo and Tianyi Hu and Fenglong Su and Ningyuan Li and Mingzhi Sun}, booktitle={Thirty-seventh Conference on Neural Information Processing Systems}, year={2023}, url={https://openreview.net/forum?id=oaGdsgB18L} }




