ZeroShot-T2I-Concepts
收藏📊 合成概念数据集概览
该数据集由米兰理工大学数据科学实验室创建,旨在利用零样本文本到图像(T2I)模型生成合成视觉概念,支持基于概念的**可解释人工智能(XAI)**研究。
🧠 研究动机
基于概念的XAI方法依赖人工标注的概念数据集,规模扩展受限。本数据集探索使用T2I模型合成概念作为一种可扩展的替代方案。
🗂️ 数据集内容
数据集包含:
- 🏷️ 真实概念图像:从多个数据集和搜索引擎收集。
- 🎨 合成概念图像:根据预定义文本提示生成。
- 🔁 每个概念包含多个样本:支持变异性分析。
每个概念对应一种人类可解释的视觉特征,例如:
- 纹理(如条纹、点状)
- 物体部件(如翅膀、轮子)
- 材质或图案
📂 项目结构
仓库根目录为 concepts/,每个概念和T2I模型拥有独立文件夹:
concepts/ ├── analysis.py # 统计辅助脚本 ├── asparagus/ │ ├── asparagus/ # 真实芦笋图像 │ ├── asparagus_flux/ # Flux 1.1生成的芦笋概念 │ ├── asparagus_gpti1/ # GPT-Image 1生成的芦笋概念 │ └── asparagus_sd35/ # Stable Diffusion 3.5生成的芦笋概念 └── ... # 其他概念类似
🔬 应用场景
- 评估基于概念的XAI方法
- 研究合成与真实概念间的表示相似性
- 分析概念内样本间的一致性
- 支撑下游解释任务
- 分析概念移除对模型解释的影响
📈 评估协议(来自论文)
- 概念表示相似性:比较合成与真实概念图像的嵌入。
- 概念内相似性:测量同一概念不同子集的一致性。
- 下游解释性能:评估在解释类别预测中的有效性。
- 概念移除影响:分析移除概念后解释行为的变化。
⚠️ 局限性
- 合成概念与真实概念间可能存在偏差。
- 生成模型会引入固有偏见。
🚀 快速开始
bash git clone https://github.com/DataSciencePolimi/ZeroShot-T2I-Concepts.git cd ZeroShot-T2I-Concepts python analysis.py # 运行分析脚本
📄 引用
bibtex @InProceedings{ZeroShot-T2I-Concepts, author = {Astolfi, Giacomo and Bianchi, Matteo and Campi, Riccardo and De Santis, Antonio and Brambilla, Marco}, title = {A Framework for Evaluating Zero-Shot Image Generation in Concept-based Explainability}, booktitle = {2026 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year = {2026} }




