FoodLogAthl-218

Name: FoodLogAthl-218
Creator: 东京大学, foo.log公司
Published: 2025-12-17 00:43:20
License: 暂无描述

arXiv2025-12-17 更新2025-12-18 收录

下载链接：

https://huggingface.co/datasets/FoodLog/FoodLogAthl-218

下载链接

链接失效反馈

官方服务：

资源简介：

FoodLogAthl-218是由东京大学和foo.log公司联合构建的真实世界食物图像数据集，基于饮食管理应用FoodLog Athl收集的用户餐食记录。该数据集包含6925张图像和14349个边界框，覆盖218个食物类别，数据来源为用户日常拍摄的餐食照片，具有自然类别不平衡和低审美偏差的特点。数据集通过多阶段过滤流程构建，包括去除无效样本、CLIP-based异常检测和手动审核，最终保留了真实世界饮食记录的自然分布。该数据集旨在支持饮食管理研究，特别是食物图像分类、增量学习和情境感知分类任务，以解决传统网络爬取数据集在真实世界应用中的局限性。

FoodLogAthl-218 is a real-world food image dataset jointly constructed by the University of Tokyo and foo.log Corporation, based on user meal records collected from the diet management application FoodLog Athl. This dataset contains 6,925 images and 14,349 bounding boxes, covering 218 food categories. Its data originates from daily meal photos taken by users, featuring natural class imbalance and low aesthetic bias. The dataset was built through a multi-stage filtering pipeline, including invalid sample removal, CLIP-based anomaly detection and manual review, ultimately preserving the natural distribution of real-world dietary records. This dataset aims to support diet management research, particularly food image classification, incremental learning and context-aware classification tasks, to address the limitations of traditional web-crawled datasets in real-world applications.

提供机构：

东京大学, foo.log公司

创建时间：

2025-12-17

搜集汇总

数据集介绍

构建方式

在饮食管理应用日益普及的背景下，FoodLogAthl-218数据集通过FoodLog Athl应用收集了2023年5月至2024年10月期间632名用户的真实餐饮记录。原始数据包含大量噪声，如缺失图像、错误标注及非食物内容，因此研究团队设计了一套多阶段过滤流程进行清洗。该流程依次移除无图像或边界框的样本，剔除样本数少于10的类别，并基于CLIP特征进行离群值检测以排除误标或非食物图像，随后通过人工审核修正边界框与标签，最终通过GPT-4o辅助的聚类合并相似类别，形成包含6,925张图像、14,349个边界框和218个食物类别的洁净子集。

使用方法

该数据集支持三类基准任务以评估模型在真实饮食记录场景下的性能。标准闭集分类任务要求模型对每道菜肴裁剪图进行218选一的类别预测。持续用户感知适应任务则利用时间序列元数据，模拟增量微调过程，评估模型随着用户记录积累而演化的性能。菜单感知分类任务进一步利用单张图像包含多道菜肴的上下文信息，要求模型结合整体餐饮描述对单个菜肴进行识别，以探索语境信息对分类的增强作用。这些任务为大型多模态模型在饮食管理领域的应用提供了系统的评估框架。

背景与挑战

背景概述

在膳食管理应用日益普及的背景下，传统的基于网络爬取图像构建的食物数据集难以反映用户真实用餐场景的视觉特征。为弥合这一研究鸿沟，东京大学与foo.log公司于2025年联合发布了FoodLogAthl-218数据集。该数据集源自膳食管理应用FoodLog Athl中用户提交的真实用餐记录，包含6,925张图像、14,349个标注框，涵盖218个食物类别。其核心创新在于采用“先收集图像后标注”的自底向上构建范式，旨在解决现有数据集中存在的审美偏差、类别分布失衡以及缺乏真实用餐上下文等问题，为开发更贴合实际应用的食物图像识别模型提供了关键资源。

当前挑战

该数据集致力于解决真实世界食物图像分类的挑战，其核心在于处理用户自发拍摄的、视觉质量参差不齐的日常用餐图像。具体挑战包括：1）领域问题挑战：模型需应对高类内多样性、自然类别不平衡、多道菜共现的复杂场景，以及利用时间序列连续性进行个性化适应；2）构建过程挑战：原始用户数据存在大量噪声，如缺失标注、错误检测、标签不一致及非食物图像，需设计多阶段过滤与聚类流程进行清洗，并在保护用户隐私的前提下，将包含超14万条目的原始标签系统合并为218个清晰类别，同时保持数据真实的时空分布特性。

常用场景

经典使用场景

在膳食管理应用领域，FoodLogAthl-218数据集为食物图像识别模型提供了贴近真实场景的训练与评估基准。该数据集源自用户日常饮食记录，图像呈现自然光照、随意摆盘及部分食用状态，这些特征模拟了个人饮食日志中的典型拍摄条件。研究者利用该数据集构建分类模型，旨在降低手动记录餐食的负担，提升自动化饮食管理的准确性。其多菜品共现的图像结构进一步支持上下文感知的分类任务，使模型能够依据整体餐食组合进行精细识别。

解决学术问题

该数据集有效应对了传统食物图像数据集中存在的学术研究局限。传统数据集多依赖网络爬取的图像，往往具有美学偏见和人为平衡的类别分布，与真实饮食记录存在显著差异。FoodLogAthl-218通过“先采集后标注”的构建方式，保留了类内多样性、自然类别不平衡以及时间序列连续性，为研究真实环境下的食物识别、增量学习与个性化建模提供了可靠数据基础。其引入的上下文感知分类与持续自适应任务，推动了饮食计算领域向更实用、用户中心化的研究方向演进。

实际应用

在实际应用中，FoodLogAthl-218数据集直接支持智能膳食管理系统的开发与优化。基于该数据集训练的模型可集成至饮食记录应用程序中，自动识别用户拍摄的餐食图像，并估算营养成分，从而减轻用户手动输入的繁琐。此外，其时间序列元数据使得系统能够适应用户的长期饮食模式，实现个性化推荐与营养指导。这类技术已被应用于日本等地的健康管理平台，帮助用户与营养师之间建立更高效的饮食监督与沟通机制。

数据集最近研究