场景/知识/模型联动的时空演变数据重构/融合图文数据集
收藏国家基础学科公共科学数据中心2026-04-04 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69ca9e1ff17560281a739a99&type=1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集面向多模态语义理解与时空演变建模研究需求,聚焦电子产品“图像-文本”跨模态对齐任务,针对工业场景中细粒度产品识别、图文语义关联挖掘的数据缺口,填补了电子设备领域多模态图文对齐专用数据集的空白,对推动跨模态AI技术在工业产品识别、智能检索等场景落地意义重大,可广泛服务于学术研究、教学实践及非商业性质人工智能技术研发。
数据集通过人工校验与自动化清洗结合构建,数据来源涵盖Camera、earphone、lcd、mobile、notebook、pc、tv 7大电子设备类别的真实产品图像与结构化标注信息,经去重、模糊图像剔除、重复型号合并等预处理,确保数据质量与可用性,具备高品类覆盖率和市场代表性。
数据集为多模态混合数据,核心是图像-文本对,聚焦“产品类型-品牌-型号”三级结构化信息对齐。图像以JPG格式存储,文本标注为UTF-8编码CSV文件,采用分层目录结构:根目录设photo/(存图像)和label/(存标注),二级目录按产品类型分类,图像文件命名为“类别_num.jpg”,标注文件为“{类别名}_label.csv”,通过文件名实现图文精准关联,每条数据含三级标签,支持多维度对齐学习。
数据体量上,共包含10624条独立图像-文本对记录,涉及407个品牌、6863种具体型号。各类别分布为:pc类3325条、tv类2078条、lcd类2093条、notebook类1825条、earphone类543条、mobile类480条、Camera类280条,规模适配跨模态模型训练与性能验证。
该数据集公开共享,适用于图文跨模态检索、细粒度图像分类、型号识别等任务,可通过主流数据分析工具快速加载,支持模块化数据处理与多格式输入转换,为“场景—知识—模型”联动的多模态语义理解研究提供坚实支撑。
提供机构:
北京航空航天大学



