five

Foreground Object Search Dataset FOSD

收藏
github2024-03-17 更新2024-05-31 收录
下载链接:
https://github.com/bcmi/Foreground-Object-Search-Dataset-FOSD
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于前景对象搜索的数据集,由ICCV 2023论文Foreground Object Search by Distilling Composite Image Feature使用。数据集包括训练和测试数据,以及相关的标签和元数据。

本数据集专为前景物体检索任务设计,源自于ICCV 2023论文《通过蒸馏合成图像特征进行前景物体搜索》(Foreground Object Search by Distilling Composite Image Feature)。该数据集涵盖了训练与测试数据,并附有相应的标签及元数据。
创建时间:
2023-07-18
原始信息汇总

数据集概述

数据集名称

  • Foreground Object Search Dataset (FOSD)

数据来源

  • Open-Images-v6 trainset
  • S-FOSD annotations
  • R-FOSD annotations
  • R-FOSD background images

数据结构

  • 训练数据

    • bg: 背景图像
    • fg: 前景图像
    • labels/masks: 标注掩码
    • train_sfosd.json, train_rfosd.json, category.json, number_per_category.csv, segmentations.csv: 训练数据相关元数据
  • 测试数据

    • bg_set1, bg_set2: 背景图像
    • fg: 前景图像
    • labels/masks: 标注掩码
    • test_set1.json, test_set2.json, segmentations.csv: 测试数据相关元数据

数据准备

  • 使用FiftyOne下载Open-Images-v6数据集,并按照指定结构解压。
  • 下载S-FOSD和R-FOSD的标注及背景图像,并保存至data目录下。
  • 运行fetch_data.py脚本生成背景和前景数据。

预训练模型

  • 提供S-FOSD和R-FOSD的评估模型,下载后保存至checkpoints目录。

测试与评估

  • 使用evaluate.py脚本进行S-FOSD和R-FOSD的评估。
  • 评估结果存储于eval_results目录。

训练

  • 下载预训练教师模型,保存至checkpoints/teacher目录。
  • 使用train_sfosd.shtrain_rfosd.sh脚本训练新模型。

兼容性评分

  • 使用demo_ui.py脚本进行前景与背景的兼容性评分。

许可证

  • S-FOSD的背景和前景图像属于Open-Images。
  • R-FOSD的背景图像来自互联网,遵循Creative Commons Attribution 4.0 License。
搜集汇总
数据集介绍
main_image_url
构建方式
Foreground Object Search Dataset (FOSD) 的构建基于Open-Images-v6数据集,通过下载并解压该数据集,结合S-FOSD和R-FOSD的标注信息,生成了背景和前景图像。数据准备过程中,使用FiftyOne工具下载Open-Images-v6数据集,并按照特定目录结构组织数据。通过执行Python脚本`fetch_data.py`,进一步生成背景和前景图像,确保数据集的完整性和一致性。
特点
FOSD数据集的特点在于其专注于前景对象的搜索任务,提供了S-FOSD和R-FOSD两个子集,分别用于不同的评估场景。数据集包含了丰富的背景和前景图像,以及相应的标注信息,如掩码和分割标签。此外,数据集还提供了类别嵌入和类别数量统计信息,便于进行更深入的分析和模型训练。数据集的多样性和标注的精细程度使其成为前景对象搜索研究的重要资源。
使用方法
使用FOSD数据集时,首先需下载并解压Open-Images-v6数据集,随后获取S-FOSD和R-FOSD的标注信息,并按照指定目录结构组织数据。通过运行`fetch_data.py`脚本生成背景和前景图像。评估模型时,可使用提供的预训练模型,并运行`evaluate.py`脚本进行测试,结果将存储在指定目录中。训练新模型时,需下载预训练的教师模型,并执行`train_sfosd.sh`或`train_rfosd.sh`脚本。此外,数据集还提供了兼容性评分功能,可通过`demo_ui.py`脚本进行交互式演示。
背景与挑战
背景概述
Foreground Object Search Dataset (FOSD) 是由Bo Zhang、Jiacheng Sui和Li Niu等研究人员于2023年提出的,旨在解决图像合成中的前景对象搜索问题。该数据集基于Open Images V6数据集构建,并包含两个子数据集:S-FOSD和R-FOSD。FOSD的核心研究问题是通过提取复合图像特征来优化前景对象与背景的兼容性,从而提升图像合成的质量。该数据集的研究成果被ICCV 2023接收,并已集成到图像合成工具箱libcom中,为图像合成领域的研究提供了重要的数据支持。
当前挑战
FOSD数据集在解决前景对象搜索问题时面临多重挑战。首先,前景对象与背景的兼容性评估需要综合考虑几何和语义特征,这对模型的复杂度和精度提出了较高要求。其次,数据集的构建过程中,如何从Open Images V6中提取有效的前景对象并生成高质量的背景图像,是一个技术难点。此外,R-FOSD的背景图像来自互联网,其多样性和质量的不一致性增加了数据处理的复杂性。这些挑战不仅影响了数据集的构建效率,也对模型的训练和评估提出了更高的要求。
常用场景
经典使用场景
Foreground Object Search Dataset (FOSD) 在计算机视觉领域中被广泛应用于前景对象搜索任务。该数据集通过提供丰富的前景和背景图像对,帮助研究人员开发和评估图像合成与前景对象检测算法。经典的使用场景包括在复杂背景中识别和定位前景对象,以及评估图像合成技术的前景与背景兼容性。
衍生相关工作
FOSD 数据集衍生了一系列经典的研究工作,特别是在图像合成和前景对象搜索领域。例如,基于 FOSD 的研究提出了多种前景对象检测和图像合成算法,这些算法在 ICCV 等顶级会议上发表。此外,FOSD 还被集成到图像合成工具箱 libcom 中,为研究人员提供了便捷的工具和资源。这些衍生工作不仅推动了相关领域的技术进步,还为未来的研究提供了坚实的基础。
数据集最近研究
最新研究方向
在计算机视觉领域,前景对象搜索(Foreground Object Search, FOS)作为图像合成与编辑的关键技术,近年来受到广泛关注。Foreground Object Search Dataset (FOSD) 的提出,为研究前景对象与背景图像的语义与几何兼容性提供了重要数据支持。该数据集结合了Open Images V6的丰富图像资源,并引入了S-FOSD和R-FOSD两种标注形式,分别针对静态和动态场景下的前景对象搜索任务。最新研究聚焦于通过蒸馏复合图像特征(Distilling Composite Image Feature)来提升前景对象搜索的精度与效率,相关成果已在ICCV 2023上发表。这一方向不仅推动了图像合成技术的发展,也为智能图像编辑、虚拟现实等应用场景提供了新的解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作