Object Detection for Olfactory References (ODOR) Dataset
收藏arXiv2025-07-11 更新2025-07-15 收录
下载链接:
https://zenodo.org/record/11070878; https://github.com/mathiaszinnen/odor-dataset; https://huggingface.co/datasets/mathiaszinnen/odor
下载链接
链接失效反馈官方服务:
资源简介:
ODOR数据集是一个针对艺术作品中的气味引用进行物体检测的中等规模数据集,包含4712张图像和38116个物体级别的注释,涵盖了139个细粒度的类别。数据集的创建基于与多学科气味专家的密切合作,旨在实现气味引用的自动识别。数据集具有复杂的类别列表和长尾分布,可服务于低样本量环境下的物体检测基准。数据集在空间分布上覆盖了整个图像画布,具有密集和重叠的物体,为物体检测模型提供了挑战。
The ODOR dataset is a medium-scale object detection dataset focused on odor references in artworks. It consists of 4,712 images and 38,116 object-level annotations, covering 139 fine-grained categories. Developed through close collaboration with multidisciplinary odor experts, this dataset aims to enable automatic recognition of odor references. Featuring a complex category list and long-tailed distribution, the dataset serves as a benchmark for object detection in low-data regimes. Its annotations span the entire image canvas spatially, with dense and overlapping objects, posing significant challenges for object detection models.
提供机构:
Pattern Recognition Lab, Friedrich-Alexander-Universit¨at, Erlangen, Germany; Royal Netherlands Academy of Arts & Sciences (KNAW), Amsterdam Netherlands; Institut f¨ur Kunstgeschichte, Philipps-Universit¨at, Marburg, Germany
创建时间:
2025-07-11
搜集汇总
数据集介绍

构建方式
ODOR数据集的构建过程体现了跨学科协作的深度与广度。研究团队通过Odeuropa项目框架,系统性地采集了来自多个数字化博物馆馆藏的4712幅艺术作品图像,覆盖139个细粒度嗅觉相关物体类别。构建过程采用两阶段标注策略:首先通过亚马逊土耳其机器人平台进行众包标注,随后由艺术史专家进行多轮校验与修正,特别针对需要专业知识的类别(如特定花卉品种或历史酒器)。数据集采用COCO JSON格式存储,包含38,116个对象级标注,并创新性地引入两级分类体系以平衡视觉相似性与分类学严谨性。
使用方法
该数据集支持多种研究范式:作为基准测试集时,建议采用90:10的标准划分(4,264训练图/448测试图),重点关注AP50和AP75指标以评估模型在艺术图像上的泛化能力;用于迁移学习时,可利用其两级分类体系进行层级预测,当细粒度分类失败时可回退至超类预测;在数字人文研究中,配套的元数据文件(含Iconclass编码、创作年代等13个字段)支持多模态方法探索。值得注意的是,YOLO-v8等无锚检测架构在小目标检测任务中展现出与DINO等复杂模型相当的性能,这为算法选择提供了重要参考。
背景与挑战
背景概述
Object Detection for Olfactory References (ODOR) Dataset是由Friedrich-Alexander-Universität Erlangen-Nürnberg模式识别实验室联合荷兰皇家艺术与科学学院等机构于2025年提出的艺术领域目标检测基准。该数据集包含4,712幅图像中的38,116个标注实例,涵盖139个细粒度类别,专门针对艺术品中嗅觉相关物体的识别任务而构建。其创新性体现在突破了传统艺术数据集的中心偏差问题,实现了物体在画布上的均匀空间分布,并首次系统性地建立了视觉艺术与嗅觉感知的跨模态关联。作为Odeuropa欧洲嗅觉遗产研究项目的重要组成部分,该数据集推动了计算人文领域对艺术作品中物质文化史的研究范式转变。
当前挑战
ODOR数据集面临的核心挑战体现在两个维度:在领域问题层面,需解决艺术品特有的跨描绘问题(Cross-depiction Problem),即同一物体在艺术表现与现实图像中的特征差异远大于同类物体在单一域内的差异;同时需应对艺术抽象化、物体密集重叠及细粒度分类带来的识别困难。在构建层面,主要挑战包括:1) 艺术品的异质性导致标注一致性难以保证,需艺术史专家参与多轮校正;2) 长尾分布问题显著,30%类别仅含不足50个实例;3) 小目标检测难题,约40%物体占据图像面积小于4%;4) 历史图像许可限制使得38%样本无法直接分发,需构建复杂的元数据索引系统。
常用场景
经典使用场景
ODOR数据集在艺术史和计算机视觉交叉领域的研究中具有重要价值,尤其在艺术品中的物体检测任务中表现突出。该数据集通过提供大量精细标注的艺术品图像,为研究者提供了一个独特的平台,用于开发和评估在复杂艺术背景下进行物体检测的算法。其应用场景包括但不限于艺术品的自动分类、风格分析以及文化遗产的数字化保护。
解决学术问题
ODOR数据集解决了艺术品图像中物体检测的多个关键问题,包括对小物体的检测、遮挡物体的识别以及物体在图像中的非中心分布问题。此外,该数据集通过提供139个细粒度类别的标注,填补了艺术品数据集中类别多样性不足的空白,为跨描绘问题的研究提供了丰富的数据支持。
实际应用
在实际应用中,ODOR数据集被用于文化遗产的数字化管理、博物馆藏品的自动分类和检索,以及艺术史研究中的定量分析。例如,研究者可以利用该数据集追踪特定物体(如花朵或器皿)在不同时期和风格的艺术品中的出现频率和分布,从而揭示艺术发展的历史脉络和文化意义。
数据集最近研究
最新研究方向
近年来,ODOR数据集在计算机视觉与数字人文交叉领域的研究中展现出显著的前沿价值。该数据集通过其精细标注的139个嗅觉相关物体类别及38,116个实例级注释,为艺术图像中的小目标检测、密集遮挡物体识别等挑战性问题提供了基准平台。研究热点集中在跨模态学习(如结合CLIP模型利用图像元数据提升检测性能)、领域自适应方法(解决艺术图像与自然图像的风格差异问题),以及在嗅觉文化遗产数字化中的应用。其非中心化的空间分布特性推动了针对艺术构图分析的算法创新,同时长尾类别分布促进了少样本学习技术的发展。该数据集通过Odeuropa等项目与嗅觉科学家、艺术史学家的深度合作,为多学科交叉研究提供了独特的数据支撑,特别是在重建欧洲嗅觉文化遗产方面具有开创性意义。
相关研究论文
- 1Smelly, dense, and spreaded: The Object Detection for Olfactory References (ODOR) datasetPattern Recognition Lab, Friedrich-Alexander-Universit¨at, Erlangen, Germany; Royal Netherlands Academy of Arts & Sciences (KNAW), Amsterdam Netherlands; Institut f¨ur Kunstgeschichte, Philipps-Universit¨at, Marburg, Germany · 2025年
以上内容由遇见数据集搜集并总结生成



