five

多模态视觉常识知识图谱

收藏
国家基础学科公共科学数据中心2026-01-03 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6953f71e195d266fa5401ce2&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集基于多模态视觉常识知识图谱的构建研究,旨在实现符号知识与视觉信息的深度融合,增强机器对现实世界的理解与推理能力。研究以ConceptNet为文本常识知识源、ImageNet-21K为视觉数据源,采用双路对比学习(DCLIP)方法,通过计算实体、类别标签及图像间的相似度,筛选出高相关度的概念对,构建出包含10450个节点、46种关系、552958个三元组的高质量多模态视觉常识知识图谱。数据的时间与空间精度均由ConceptNet与ImageNet提供的结构化标注保证,时间范围覆盖两大数据源的全量公开版本。为确保数据质量,采用基于视觉思维链的多模态常识检验算法和基于高阶特征解耦的视觉安全合规检验算法,对不符合常识及存在潜在风险的三元组进行过滤,最终经自研模型测试的查询准确率达87.91%,验证了数据的合理性与可靠性。本数据集可广泛应用于语义理解、视觉问答、因果推理、多模态检索等领域,为智能系统提供更加丰富和符合现实语义的知识支撑。
提供机构:
北京大学
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个高质量的多模态视觉常识知识图谱,基于ConceptNet和ImageNet-21K构建,采用双路对比学习方法,包含10450个节点、46种关系和552958个三元组。通过算法过滤确保数据合理性与可靠性,查询准确率达87.91%,可广泛应用于语义理解、视觉问答和因果推理等领域。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务