FACETS OOD Detection
收藏arXiv2024-04-16 更新2024-06-21 收录
下载链接:
https://huggingface.co/datasets/GrainsPolito/FACETS
下载链接
链接失效反馈官方服务:
资源简介:
FACETS OOD Detection数据集是由都灵理工大学的FRESCO研究线开发的,旨在通过深度学习工具分析社交媒体上的大量个人资料图片。该数据集模拟了一个预训练的图像标记模型,需要在开放世界假设下操作。数据集主要用于场景分类任务,以Places365数据集作为ID集,从ImageNet中抽取OOD样本。数据集的创建涉及自动和手动标记技术,以及基于WordNet的语义相似性度量,以确定哪些类应被视为ID、近OOD或远OOD。该数据集的应用领域包括社交媒体图像分析,旨在解决模型在面对未知样本时的过拟合和错误预测问题。
The FACETS OOD Detection Dataset was developed by the FRESCO research line at Politecnico di Torino. It aims to analyze large volumes of profile pictures on social media using deep learning tools. This dataset simulates a pre-trained image tagging model that must operate under the open-world assumption. The dataset is primarily used for scene classification tasks, taking the Places365 dataset as the in-distribution (ID) set and extracting out-of-distribution (OOD) samples from ImageNet. Its creation involves both automatic and manual annotation techniques, alongside WordNet-based semantic similarity metrics to classify which classes qualify as ID, near-OOD, or far-OOD. The application scope of this dataset covers social media image analysis, and it is designed to address the issues of model overfitting and erroneous predictions when encountering unknown samples.
提供机构:
都灵理工大学
创建时间:
2024-04-16
搜集汇总
数据集介绍

构建方式
在开放世界识别的研究背景下,FACETS OOD Detection 数据集的构建旨在超越传统基于数据集来源的简单划分,转而依据类别的语义相似性来精确定义分布内外样本。该基准以场景分类任务为核心案例,将Places365数据集设定为分布内数据源,而分布外样本则主要从ImageNet和SUN397数据集中抽取。构建过程的关键创新在于引入了基于语义亲和力的细粒度标注策略:通过结合自动化的WordNet概念路径相似性计算与人工审查,为每个候选类别分配一个分布外程度评分,从而创建了包含近分布外与远分布外样本的、具有不同难度梯度的多个基准变体。这种构建方式确保了评估环境更贴近现实应用中语义边界模糊的复杂场景。
特点
该数据集的核心特征在于其高度的现实复杂性与语义导向的评估框架。区别于广泛使用的小规模、低分辨率玩具数据集,FACETS OOD Detection 基于大规模、高分辨率的真实世界图像数据集,显著提升了评估任务的挑战性。其最突出的特点是摒弃了将整个外部数据集笼统视为分布外的传统做法,而是依据类别语义内容,将ImageNet等数据源中的类别动态划分为分布内、近分布外或远分布外,从而精准模拟了实际应用中可能遇到的、与训练数据存在微妙语义关联的未知样本。此外,数据集提供了多个配置版本,允许研究者在不同严格程度的语义相似性阈值下进行测试,为全面衡量检测方法的鲁棒性提供了多维度的评估尺度。
使用方法
该数据集主要用于评估在开放世界假设下,深度神经网络模型对于分布外样本的检测能力。研究者通常使用在Places365上预训练的场景分类模型作为基础分类器,然后在FACETS提供的不同基准分割上进行测试。评估时,无需对基础分类器进行重新训练,而是专注于应用各种后验评分方法,如最大软概率、基于温度缩放的逻辑值或专门的外部检测器,为每个测试样本计算一个分布外分数。通过设定阈值并将分数二值化,即可得到样本的分布内外预测。数据集的验证集和测试集划分确保了超参数调优与最终性能评估的独立性,其提供的细粒度标注也支持对模型在语义相似类别上的错误模式进行深入分析。
背景与挑战
背景概述
在深度学习模型日益广泛部署于现实应用的背景下,模型对分布外样本的鲁棒性成为关键研究议题。FACETS OOD Detection 数据集由意大利都灵理工大学的研究团队于2024年提出,旨在构建一个更贴近真实场景的分布外检测基准。该数据集以场景分类任务为核心,将Places365作为分布内数据,并依据语义相似性从ImageNet中筛选分布外样本,从而模拟社交媒体图像标注等开放世界场景中的实际挑战。其创新之处在于突破了传统基准仅依赖数据集来源划分的局限,通过语义关联性定义近分布外与远分布外类别,为评估OOD检测方法的实际效能提供了更细致的标准。
当前挑战
该数据集致力于解决分布外检测领域中的核心挑战:如何使模型在开放世界场景中准确识别与训练分布语义相近的未知样本。传统基准常使用语义差异显著的远分布外样本,难以反映现实应用中近分布外样本的微妙差异。在构建过程中,研究团队面临语义相似性度量的复杂性挑战,需利用WordNet等知识库建立跨数据集的类别映射,并融合自动与人工标注以平衡客观性与准确性。此外,数据集的构建还需克服类别间视觉与语义重叠带来的混淆,例如场景与对象类别的关联性,这要求精细的标注策略以确保基准的严谨性与实用性。
常用场景
经典使用场景
在开放世界场景识别领域,FACETS OOD Detection 数据集为评估深度神经网络在语义相似性干扰下的分布外检测能力提供了基准。该数据集以 Places365 作为分布内数据,并依据语义亲和度从 ImageNet 和 SUN397 中筛选出分布外样本,构建了包含近分布外和远分布外样本的复杂测试环境。其经典使用场景在于系统性地评测各类后处理检测方法,如最大软概率、温度缩放和最大逻辑值等,在面临语义相近但类别不同的样本时的区分效能,从而揭示模型在真实开放环境中的实际泛化边界。
衍生相关工作
FACETS OOD Detection 数据集的构建理念与方法衍生并连接了多项经典研究工作。其语义驱动的基准构建思路与 Ahmed 等人关于语义异常检测的研究以及 Yang 等人关于语义连贯的分布外检测工作一脉相承。在评测方法上,该数据集系统评估了 Hendrycks 等人的最大软概率基线、Liang 等人的 ODIN 方法、以及基于最大逻辑值等系列后处理技术,清晰地展现了不同方法在近分布外样本上的性能排序变化。此外,其基于 Places365 和 ImageNet 的设定也与 Roady 等人关于大规模数据集分布外检测有效性的探索形成对话与补充,共同推动了面向真实世界的评估基准发展。
数据集最近研究
最新研究方向
在开放世界识别领域,FACETS OOD Detection 数据集的推出标志着分布外检测研究从传统的远分布样本评估转向更具现实复杂性的近分布语义边界探索。该数据集通过融合ImageNet与Places365的语义层次结构,并引入WordNet概念相似性度量,构建了基于类级语义亲和力的细粒度评估基准。这一创新促使研究焦点集中于语义相干性检测,即如何区分视觉特征相似但语义类别不同的近分布样本,例如区分“卧室”场景与“床”物体这类语义关联紧密的类别。当前前沿研究正致力于开发能够理解场景-对象层级关系的检测模型,以应对社交媒体图像自动标注等实际应用中面临的开放世界挑战。该数据集的建立不仅揭示了传统置信度检测方法在近分布场景下的局限性,更推动了基于语义嵌入与层次化决策的检测范式演进,为构建更稳健的开放世界视觉系统提供了关键评估工具。
相关研究论文
- 1Toward a Realistic Benchmark for Out-of-Distribution Detection都灵理工大学 · 2024年
以上内容由遇见数据集搜集并总结生成



