five

Reddit Photoshop Battles Image Provenance Datasets

收藏
github2024-05-15 更新2024-05-31 收录
下载链接:
https://github.com/CVRL/Reddit_Provenance_Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
Reddit Photoshop Battles Image Provenance Datasets是一个自动生成的图像来源案例集合,包括节点和边信息,用于研究图像的关联和修改版本及其关系。这些案例来源于Reddit上的Photoshop Battles社区,其中成员通过使用Photoshop或GIMP等工具对原始照片进行创意编辑,形成了一系列迭代编辑的图像,这些图像及其关系被构建为图结构,用于图像来源和系统发育相关的任务。

The Reddit Photoshop Battles Image Provenance Datasets is an automatically generated collection of image provenance cases, including node and edge information, designed for researching the associations and modified versions of images along with their relationships. These cases originate from the Photoshop Battles community on Reddit, where members creatively edit original photos using tools such as Photoshop or GIMP, resulting in a series of iteratively edited images. These images and their relationships are structured into graph formats, utilized for tasks related to image provenance and phylogeny.
创建时间:
2018-07-03
原始信息汇总

Reddit Photoshop Battles Image Provenance Datasets 概述

数据集描述

Reddit Photoshop Battles是一个在线社区,举办比赛以产生最有趣、相关或创意的原始照片编辑版本。数据集专注于数字图像来源追踪,旨在寻找与问题图像相关联的修改版本,并描述它们之间的关系。这些关系以图的形式表示,其中节点代表图像,边代表它们之间的关系。

数据集结构

每个来源案例通过分析图像发布评论线程中的时间戳和父子关系来推断。每个图有一个根节点,代表原始图像。数据集中的每个图案例都有一个JSON文件,描述其结构,包括节点和链接的详细信息。

数据集使用

数据集的JSON文件位于Datasets文件夹中,目前提供的是Datasets/TIP2018文件夹中的案例。生成数据集的命令为:

python2 DownloadRedditDataset.py <json folder> -outputDir <output folder>

可视化图像关系图的命令为:

python Visualize/GenerateGraphVisuals.py $DSET #Generate interactive HTML files at $DSET/Visuals python Visualize/StartVisServer.py $DSET #Start serving images to the javascript graphs

注意事项

数据集JSON文件中的内容可能包含不适合工作场所的材料,且并非所有图像都公开授权,使用前请获取创作者的许可。

引用信息

若使用此数据集,请引用:

@article{moreira2018image, title={Image Provenance Analysis at Scale}, author={Moreira, Daniel and Bharati, Aparna and Brogan, Joel and Pinto, Allan and Parowski, Michael and Bowyer, Kevin W and Flynn, Patrick J and Rocha, Anderson and Scheirer, Walter J}, journal={arXiv preprint arXiv:1801.06510}, year={2018} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过分析Reddit Photoshop Battles社区中的评论线程,利用时间戳和父子关系推断出每个图像的谱系关系。每个谱系案例以图结构表示,其中根节点为原始图像,其他节点为经过编辑的图像。通过这种方式,数据集构建了一个完整的图像谱系图,展示了图像在社区中的演变过程。
特点
该数据集的显著特点在于其基于社区互动的迭代编辑过程,提供了丰富的图像谱系案例。每个案例以JSON格式存储,包含图像的URL、评论、时间戳等信息,便于进行图像谱系分析。此外,数据集支持可视化,用户可以通过Cytoscape.js直观地查看图像之间的关系图。
使用方法
用户可以通过运行提供的Python脚本生成数据集,并指定输出目录。生成的数据集包含每个Photoshop Battle案例的图像文件夹及其相关信息。此外,用户可以使用提供的脚本生成交互式HTML文件,通过Cytoscape.js可视化图像谱系图。数据集的JSON结构清晰,便于进一步的分析和处理。
背景与挑战
背景概述
Reddit Photoshop Battles Image Provenance Datasets(Reddit Photoshop 大战图像来源数据集)是由一群研究人员创建的,旨在解决数字图像来源分析这一核心研究问题。该数据集源自Reddit社区的Photoshop大战,参与者通过迭代编辑原始图像,生成了一系列具有创意和娱乐性的图像。这些图像为图像来源和谱系分析提供了理想的案例。数据集的核心研究问题是通过时间戳和评论线程中的父子关系,推断出图像之间的关联性,并构建图像关系的图结构。该数据集由Moreira等人于2018年创建,主要研究人员包括Daniel Moreira、Joel Brogan等,他们的研究对图像来源分析领域产生了重要影响,特别是在大规模图像来源分析方面。
当前挑战
该数据集面临的挑战主要集中在两个方面。首先,图像来源分析任务本身具有复杂性,需要准确识别和描述图像之间的修改关系,并构建相应的图结构。这一过程涉及大量的图像处理和关系推断,尤其是在处理大规模数据时,计算复杂度和数据管理成为主要挑战。其次,数据集的构建过程中,研究人员需要从Reddit社区中提取和整理大量的图像和评论数据,确保数据的准确性和一致性。此外,由于部分图像可能涉及不适宜内容或版权问题,数据集的使用和分发也面临一定的法律和伦理挑战。
常用场景
经典使用场景
Reddit Photoshop Battles Image Provenance Datasets 主要用于图像溯源任务,即识别和描述图像的修改历史及其相互关系。通过构建图像之间的父子关系图,该数据集为研究者提供了一个理想的实验平台,用于探索图像编辑的迭代过程和图像间的关联性。
实际应用
在实际应用中,Reddit Photoshop Battles Image Provenance Datasets 可用于社交媒体内容的真实性验证、版权保护以及图像编辑工具的性能评估。此外,该数据集还可应用于教育和培训领域,帮助学生和专业人士理解图像编辑的复杂性和潜在的误用风险。
衍生相关工作
基于该数据集,研究者们开发了多种图像溯源和谱系分析算法,推动了图像取证和内容安全领域的技术进步。例如,Moreira 等人提出的图像溯源分析方法,通过大规模数据集的实验验证,显著提升了图像溯源的准确性和效率。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作