five

ADPL

收藏
arXiv2025-07-11 更新2025-07-12 收录
下载链接:
https://github.com/amoreZgx1n/SAGE
下载链接
链接失效反馈
官方服务:
资源简介:
ADPL数据集是一个针对工业异常推理的偏好优化数据集,包含28,415个问答实例,每个实例包括一对测试-参考图像以及由领域专家排名的四个候选答案。该数据集旨在支持对异常推理模型的质量进行综合评估,通过多尺度逻辑评估框架(MLE)衡量模型在识别精度、定位精度和推理一致性三个关键维度上的性能。
提供机构:
哈尔滨工业大学
创建时间:
2025-07-11
原始信息汇总

SAGE数据集概述

数据集基本信息

  • 数据集名称: AD-PL (Anomaly Detection and Reasoning Dataset)
  • 相关论文: "SAGE: A Visual Language Model for Anomaly Detection via Fact Enhancement and Entropy-aware Alignment" (ACM Multimedia 2025)
  • 官方仓库: https://github.com/amoreZgx1n/SAGE

数据集下载

  • AD-PL下载地址: https://pan.baidu.com/s/1Jr68D6ysgdEFgOB0UTZJdw?pwd=b2nd
  • 其他相关数据集:
    • MANTA: https://grainnet.github.io/MANTA
    • MMAD: https://github.com/jam-cc/MMAD

数据集用途

  • 主要用途: 异常检测与推理
  • 适用场景: 视觉语言模型的训练与测试

相关资源

  • 预训练模型: InternVL2-8B (https://huggingface.co/OpenGVLab/InternVL2-8B)
  • 许可证: Apache-2.0 License

引用信息

bibtex @misc{zang2025sagevisuallanguagemodel, title={SAGE: A Visual Language Model for Anomaly Detection via Fact Enhancement and Entropy-aware Alignment}, author={Guoxin Zang and Xue Li and Donglin Di and Lanshun Nie and Dechen Zhan and Yang Song and Lei Fan}, year={2025}, eprint={2507.07939}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2507.07939}, }

搜集汇总
数据集介绍
main_image_url
构建方式
ADPL数据集通过三阶段流程构建,首先利用GPT-4o生成对象特定的图像描述并人工验证,随后设计多样化的异常场景和问题模板,最终通过GPT-4o生成结构化问答对。该数据集包含28,415个问答实例,每个实例包含四个偏好排序的响应,涵盖了标准比较、缺陷识别和深度诊断三个难度级别。数据来源包括MVTec QA、VisA QA和MPDD QA,确保了数据的多样性和广泛性。
使用方法
ADPL数据集主要用于训练和评估视觉语言模型在工业异常检测中的推理能力。通过结合测试-参考图像对和偏好排序的答案,模型可以学习专家级的异常识别和解释能力。使用方法包括零样本和少样本设置,支持模型在缺陷类型识别、定位精度和逻辑推理等方面的性能评估。数据集还可用于多尺度逻辑评估(MLE),通过GPT-4o量化模型在异常识别、定位和推理一致性上的表现。
背景与挑战
背景概述
ADPL数据集由哈尔滨工业大学与DZ Matrix等机构的研究团队于2025年提出,旨在解决工业异常检测中视觉-语言模型(VLMs)的领域适应性问题。该数据集包含28,415个经过专家排序的问答实例,通过测试-参考图像对比范式,专注于异常推理的可解释性与跨类别泛化能力。作为SAGE框架的核心组成部分,ADPL通过融合领域知识增强与熵感知偏好优化,显著提升了工业场景下微小缺陷的语义理解与逻辑推理能力,填补了传统无监督方法在结构化分析方面的空白。其创新性体现在首次将多尺度逻辑评估(MLE)引入异常检测领域,为质量检测、设备维护等工业应用提供了标准化评估基准。
当前挑战
工业异常检测面临双重挑战:在领域问题层面,现有VLMs难以平衡通用视觉概念与工业场景特有的异常定义(如药品胶囊褪色、电缆内部损伤等细微特征),且缺乏对未知类别的零样本适应能力;在构建过程中,ADPL需克服标注成本高、专家知识标准化困难等难题,特别是对28,415个实例的答案进行四层级偏好排序需要严谨的领域共识。此外,数据异构性(整合MVTec/VisA/MPDD等多源数据)与推理逻辑的一致性验证(通过GPT-4o量化评估)也增加了数据集构建的复杂度。这些挑战促使研究者开发基于熵差的直接偏好优化(E-DPO)策略,以解决响应排序中的模糊边界问题。
常用场景
经典使用场景
ADPL数据集在工业异常检测领域具有广泛的应用价值,特别是在需要精确、结构化分析和上下文感知的场景中。该数据集通过提供28,415个带有专家排序答案的问答实例,为视觉语言模型(VLMs)在异常检测和推理任务中提供了丰富的训练和评估资源。其经典使用场景包括工业产品的质量检测、设备故障诊断以及生产线上的异常监控,这些场景要求模型不仅能够识别异常,还能提供解释性推理。
解决学术问题
ADPL数据集解决了工业异常检测中的多个关键学术问题。首先,它通过提供专家排序的答案,帮助模型学习如何生成符合领域专家偏好的解释性推理。其次,数据集的多尺度逻辑评估(MLE)框架为模型提供了定量分析工具,使其能够在异常识别、定位精度和推理一致性等多个维度上进行优化。此外,ADPL还解决了现有VLMs在工业场景中泛化能力不足的问题,通过对比学习和事实增强(SFE)技术,提升了模型对未见类别和罕见语义异常的检测能力。
实际应用
在实际应用中,ADPL数据集被广泛用于工业自动化和智能制造领域。例如,在制药行业中,该数据集可以用于检测药品包装的缺陷,如胶囊的裂纹或颜色不一致,确保药品的安全性和有效性。在电子制造中,ADPL帮助识别电路板上的焊接缺陷或元件损坏,从而提高产品质量和生产效率。此外,该数据集还应用于设备维护,通过分析设备部件的异常状态,预测潜在故障并制定维护计划,减少停机时间和维修成本。
数据集最近研究
最新研究方向
近年来,视觉语言模型(VLMs)在工业异常检测领域展现出巨大的潜力,但仍面临领域特定知识不足和解释性差等挑战。ADPL数据集的提出为这一领域注入了新的活力,其核心研究方向聚焦于如何通过事实增强和熵感知对齐技术提升模型的异常推理能力。该数据集包含28,415个专家排名的问答实例,为模型训练提供了丰富的监督信号。前沿探索主要围绕多模态对比学习展开,通过自引导事实增强模块整合领域知识,并利用熵感知直接偏好优化技术使模型输出更符合专家判断。这一方向与当前工业4.0背景下智能质检的热点需求深度契合,其创新性在于将传统异常检测的视觉模式识别升级为可解释的语义推理系统。该数据集对推动智能制造中的自主决策系统发展具有显著意义,特别是在处理未知类别异常和提供可操作建议方面展现出独特价值。
相关研究论文
  • 1
    SAGE: A Visual Language Model for Anomaly Detection via Fact Enhancement and Entropy-aware Alignment哈尔滨工业大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作