five

Entity Relatedness Test Data

收藏
NIAID Data Ecosystem2026-03-10 收录
下载链接:
https://figshare.com/articles/dataset/Entity_Relatedness_Test_Data/5234701
下载链接
链接失效反馈
官方服务:
资源简介:
The entity relatedness problem refers to the question of computing the relationship paths that better describe the connectivity between a given entity pair. This dataset supports the evaluation of approaches that address the entity relatedness problem. It covers two familiar domains, music and movies, and uses data available in IMDb and last.fm, which are popular reference datasets in these domains. The dataset contains 20 entity pairs from each of these domains and, for each entity pair, a ranked list with 50 relationship paths. It also contains entity ratings and property relevance scores for the entities and properties used in the paths. The data is compressed in .zip format and can be uncompressed by standard compression utilities. The data are split into three archives: EntityRelatednessTestData to RDF.zip: contains raw (.txt) and rdf test data along with test scripts (.java) and java class (.class) files. ontology.zip: contains the .rdf ontology for the entity relatedness test dataset dataset.zip: contains the entity relatedness test dataset in .rdf, .ttl and .nt formats The underlying data and code can be accessed through standard text edit software.

实体关联度问题旨在求解能够更准确描述给定实体对之间连通性的关系路径。 本数据集可用于评估针对实体关联度问题的各类求解方法。 该数据集涵盖音乐与电影两大常见领域,采用了两个领域内广受欢迎的参考数据集IMDb与last.fm中的公开数据。 每个领域各包含20组实体对,且为每组实体对提供了含50条关系路径的排序列表。 此外,数据集还包含路径中所使用实体的实体评分,以及对应属性的属性关联度评分。 数据集以.zip压缩格式存储,可通过标准压缩工具解压。 数据集分为三个压缩包: EntityRelatednessTestData to RDF.zip:包含原始(.txt)格式与资源描述框架(RDF)格式的测试数据,以及测试脚本(.java)与Java类(.class)文件; ontology.zip:包含本实体关联度测试数据集对应的.rdf格式本体文件; dataset.zip:包含.rdf、.ttl及.nt三种格式的实体关联度测试数据集。 数据集的原始数据与代码可通过标准文本编辑软件访问。
创建时间:
2017-09-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作