FB15k / FB15k-237|知识图谱数据集|实体关系数据集
收藏数据集概述
数据集名称
- FB15k / FB15k-237
- WN18 / WN18RR
数据集来源
- FB15k / FB15k-237: 基于Freebase知识图谱,后匹配Wikidata实体并获取元数据。
- WN18 / WN18RR: 来自WordNet数据,包含18/11种关系。
数据集内容
- FB15k / FB15k-237: 包含通过Freebase ID提及的实体,后通过Wikidata和DBPedia匹配获取的元数据。
- WN18 / WN18RR: 包含WordNet中的实体及其关系,通过验证关系将数据集转换回WordNet synsets。
数据集文件
- FB15k / FB15k-237: 包含
entity2wikidata.json
文件,用于存储Freebase实体的元数据。
数据集处理
- FB15k / FB15k-237: 使用Python脚本通过SPARQL查询和Wikidata API匹配和获取实体信息。
- WN18 / WN18RR: 通过验证关系将WordNet中的实体转换回synsets。
数据集注意事项
- FB15k / FB15k-237: 约40个实体无法找到文本信息。
- WN18 / WN18RR: WN18数据集存在信息泄露问题,不应用于研究评估。
数据集使用
- FB15k / FB15k-237: 提供用于知识图谱完成的文本信息,使用时需谨慎。
- WN18 / WN18RR: 提供WordNet实体的文本表示,可通过NLTK库加载和使用。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录