场景/知识/模型联动的时空演变数据重构/融合图文数据集

Name: 场景/知识/模型联动的时空演变数据重构/融合图文数据集
Creator: 北京航空航天大学
License: 暂无描述

国家基础学科公共科学数据中心2026-04-04 收录

下载链接：

https://nbsdc.cn/general/dataDetail?id=69ca9e1ff17560281a739a99&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集面向多模态语义理解与时空演变建模研究需求，聚焦电子产品“图像-文本”跨模态对齐任务，针对工业场景中细粒度产品识别、图文语义关联挖掘的数据缺口，填补了电子设备领域多模态图文对齐专用数据集的空白，对推动跨模态AI技术在工业产品识别、智能检索等场景落地意义重大，可广泛服务于学术研究、教学实践及非商业性质人工智能技术研发。数据集通过人工校验与自动化清洗结合构建，数据来源涵盖Camera、earphone、lcd、mobile、notebook、pc、tv 7大电子设备类别的真实产品图像与结构化标注信息，经去重、模糊图像剔除、重复型号合并等预处理，确保数据质量与可用性，具备高品类覆盖率和市场代表性。数据集为多模态混合数据，核心是图像-文本对，聚焦“产品类型-品牌-型号”三级结构化信息对齐。图像以JPG格式存储，文本标注为UTF-8编码CSV文件，采用分层目录结构：根目录设photo/（存图像）和label/（存标注），二级目录按产品类型分类，图像文件命名为“类别_num.jpg”，标注文件为“{类别名}_label.csv”，通过文件名实现图文精准关联，每条数据含三级标签，支持多维度对齐学习。数据体量上，共包含10624条独立图像-文本对记录，涉及407个品牌、6863种具体型号。各类别分布为：pc类3325条、tv类2078条、lcd类2093条、notebook类1825条、earphone类543条、mobile类480条、Camera类280条，规模适配跨模态模型训练与性能验证。该数据集公开共享，适用于图文跨模态检索、细粒度图像分类、型号识别等任务，可通过主流数据分析工具快速加载，支持模块化数据处理与多格式输入转换，为“场景—知识—模型”联动的多模态语义理解研究提供坚实支撑。

提供机构：

北京航空航天大学