Reddit Photoshop Battles Image Provenance Datasets
收藏Reddit Photoshop Battles Image Provenance Datasets 概述
数据集描述
Reddit Photoshop Battles是一个在线社区,举办比赛以产生最有趣、相关或创意的原始照片编辑版本。数据集专注于数字图像来源追踪,旨在寻找与问题图像相关联的修改版本,并描述它们之间的关系。这些关系以图的形式表示,其中节点代表图像,边代表它们之间的关系。
数据集结构
每个来源案例通过分析图像发布评论线程中的时间戳和父子关系来推断。每个图有一个根节点,代表原始图像。数据集中的每个图案例都有一个JSON文件,描述其结构,包括节点和链接的详细信息。
数据集使用
数据集的JSON文件位于Datasets文件夹中,目前提供的是Datasets/TIP2018文件夹中的案例。生成数据集的命令为:
python2 DownloadRedditDataset.py <json folder> -outputDir <output folder>
可视化图像关系图的命令为:
python Visualize/GenerateGraphVisuals.py $DSET #Generate interactive HTML files at $DSET/Visuals python Visualize/StartVisServer.py $DSET #Start serving images to the javascript graphs
注意事项
数据集JSON文件中的内容可能包含不适合工作场所的材料,且并非所有图像都公开授权,使用前请获取创作者的许可。
引用信息
若使用此数据集,请引用:
@article{moreira2018image, title={Image Provenance Analysis at Scale}, author={Moreira, Daniel and Bharati, Aparna and Brogan, Joel and Pinto, Allan and Parowski, Michael and Bowyer, Kevin W and Flynn, Patrick J and Rocha, Anderson and Scheirer, Walter J}, journal={arXiv preprint arXiv:1801.06510}, year={2018} }




