"FoodFake-30K: A Dataset for Real vs. AI-Generated Food Image Detection"

Name: "FoodFake-30K: A Dataset for Real vs. AI-Generated Food Image Detection"
Creator: IEEE DataPort
Published: 2026-03-31 19:04:44
License: 暂无描述

DataCite Commons2026-03-31 更新2026-05-03 收录

下载链接：

https://ieee-dataport.org/documents/foodfake-30k-dataset-real-vs-ai-generated-food-image-detection-0

下载链接

链接失效反馈

官方服务：

资源简介：

"FoodFake-30K is a large-scale benchmark dataset for AI-generated food image detection, containing 30,000 images across 15 diverse food categories. The dataset includes 15,000 real food photographs sourced from Pexels, Unsplash, Pixabay, Reddit (r\/food), and Food-101, alongside 15,000 AI-generated images produced by two state-of-the-art generative models: Flux-2 Klein (9B-parameter Diffusion Transformer, FP8) and Z-Image Turbo (AuraFlow Diffusion Transformer, BF16).Real images underwent a rigorous preprocessing pipeline \u2014 CLIP-based semantic filtering (openai\/clip-vit-large-patch14), perceptual hash deduplication (pHash), and manual review. AI image prompts were generated using Qwen 2.5 Coder 14B with structured diversity slots (angle \u00d7 lighting \u00d7 scene \u00d7 lens) to maximize visual variety. Images are provided at 1024\u00d71024 resolution (27,400 images) and 512\u00d7512 resolution (2,600 Food-101 images). The 15 food categories span global cuisines: baklava, biryani, burger, cake\/pastry, croissant, dim sum, falafel, hummus, pizza, plov, ramen, salad, steak, sushi, and tacos \u2014 with 2,000 images per category (1,000 real + 500 Flux + 500 Z-Turbo). FoodFake-30K supports research in fake image detection, image forensics, food authenticity verification, deepfake detection benchmarking, and cross-category generalization studies. All metadata including generation prompts, seeds, and source URLs is provided under CC BY 4.0."

FoodFake-30K是一款面向AI生成食品图像检测的大规模基准数据集，涵盖15个多样化食品类别的30000张图像。该数据集包含15000张真实食品照片，数据源自Pexels、Unsplash、Pixabay、Reddit（r/food板块）以及Food-101；另有15000张AI生成图像，由两款当前顶尖的生成模型生成：Flux-2 Klein（90亿参数扩散Transformer（Diffusion Transformer），FP8精度）与Z-Image Turbo（AuraFlow扩散Transformer，BF16精度）。真实图像经过严格的预处理流程——基于CLIP（Contrastive Language-Image Pre-training）的语义过滤（采用openai/clip-vit-large-patch14模型）、感知哈希（pHash）去重以及人工审核。AI生成图像的提示词通过通义千问（Qwen）2.5 Coder 14B生成，采用结构化多样性插槽（角度×光照×场景×镜头）设计，以最大化视觉多样性。数据集提供两种分辨率的图像：1024×1024分辨率共27400张，以及512×512分辨率的2600张Food-101来源图像。15个食品类别覆盖全球料理，包括巴克拉瓦（baklava）、比尔亚尼焖饭（biryani）、汉堡、蛋糕/糕点、可颂、点心（dim sum）、法拉费（falafel）、鹰嘴豆泥（hummus）、披萨、抓饭（plov）、拉面（ramen）、沙拉、牛排、寿司、塔可（tacos），每个类别包含2000张图像（1000张真实图像、500张Flux生成图像与500张Z-Turbo生成图像）。FoodFake-30K可支撑伪造图像检测、图像取证、食品真实性验证、深度伪造检测基准测试以及跨类别泛化研究等方向的科研工作。所有元数据（包括生成提示词、随机种子及来源URL）均采用CC BY 4.0协议开放共享。

提供机构：

IEEE DataPort

创建时间：

2026-03-31

5,000+

优质数据集

54 个

任务类型

进入经典数据集