FB15k|知识图谱数据集|实体关系抽取数据集
收藏
- FB15k数据集首次发表,作为Freebase知识图谱的子集,用于研究知识图谱嵌入和链接预测问题。
- FB15k数据集在Bordes等人的研究中首次应用,该研究提出了TransE模型,显著推动了知识图谱嵌入技术的发展。
- 随着知识图谱研究的深入,FB15k数据集被广泛应用于多种知识图谱嵌入模型的评估和比较,成为该领域的重要基准数据集。
- FB15k数据集的扩展版本FB15k-237发布,旨在解决原始数据集中存在的逆关系问题,进一步推动了知识图谱嵌入技术的研究。
- 1Translating Embeddings for Modeling Multi-relational DataUniversity of Cambridge · 2013年
- 2Convolutional 2D Knowledge Graph EmbeddingsUniversity of Oxford · 2018年
- 3RotatE: Knowledge Graph Embedding by Relational Rotation in Complex SpaceUniversity of Waterloo · 2019年
- 4A Re-evaluation of Knowledge Graph Completion MethodsUniversity of California, Berkeley · 2020年
- 5Learning Attention-based Embeddings for Relation Prediction in Knowledge GraphsUniversity of Cambridge · 2019年
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
豆瓣数据集
该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据,并与movielens ml-latest数据集通过共同的imdb字段进行交集处理,最终得到15752条共同数据。数据存储格式为JSON,支持导入到MongoDB或其他数据库使用。
github 收录
UAV-VisLoc - 用于无人机视觉定位的大规模数据集
UAV-VisLoc数据集由北京邮电大学、中科院和香港城市大学联合构建,旨在解决无人机在失去全球导航卫星系统信号时的精确定位问题。该数据集涵盖了中国11个不同地点的无人机图像,捕获了多样化的地形特征,包括固定翼无人机和多地形无人机在不同高度和方向上拍摄的6742张图像以及11幅卫星地图。每张图像均附有经纬度、高度、拍摄日期和航向角等元数据,为模型的训练与测试提供了丰富多元的数据支持。UAV-VisLoc数据集用于支持无人机视觉定位任务,为无人机视觉定位任务提供了训练和测试样本,通过匹配无人机拍摄的地面向下视角图像与正射卫星地图,实现无人机的自主视觉定位。
github 收录