five

food_recognition_2022_processed

收藏
Hugging Face2025-07-22 更新2025-07-23 收录
下载链接:
https://huggingface.co/datasets/zhiyingzou0202/food_recognition_2022_processed
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含图像及其相关信息的图像数据集,其中包括图像ID,图像,宽度,高度,图像中的对象ID,对象的边界框坐标,对象的类别,以及一些标签信息。数据集被分为训练集、验证集和测试集,分别包含37910,3791和3791个示例。
创建时间:
2025-07-21
原始信息汇总

数据集概述

基本信息

  • 数据集名称: food_recognition_2022_processed
  • 下载大小: 4296497656 bytes
  • 数据集大小: 2066361568.2800002 bytes

数据特征

  • image_id: int64,图像唯一标识符
  • image: image,图像数据
  • width: int32,图像宽度
  • height: int32,图像高度
  • objects: 结构体,包含以下字段:
    • id: list[int64],对象标识符列表
    • bbox: list[list[float32]],边界框坐标列表,每个边界框包含4个浮点数
    • category: list[string],对象类别列表
  • name_label: string,名称标签
  • bbox_location_name_label: string,边界框位置名称标签

数据划分

  • 训练集 (train):
    • 样本数量: 37910
    • 数据大小: 1635730395.88 bytes
  • 验证集 (validation):
    • 样本数量: 3791
    • 数据大小: 215315586.2 bytes
  • 测试集 (test):
    • 样本数量: 3791
    • 数据大小: 215315586.2 bytes

配置文件

  • 默认配置 (default):
    • 训练集路径: data/train-*
    • 验证集路径: data/validation-*
    • 测试集路径: data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与食品识别领域,food_recognition_2022_processed数据集通过系统化的数据采集与标注流程构建而成。该数据集包含37,910张训练图像及3,791张验证和测试图像,每张图像均标注了食品对象的边界框坐标、类别标签及图像元数据。采用结构化存储格式,将图像ID、尺寸信息与物体级注释(包括类别名称和定位框)整合为统一的数据框架,确保了数据的完整性与可追溯性。
特点
该数据集的核心价值在于其精细的多层级标注体系,不仅提供图像级别的名称标签,还包含物体检测任务所需的实例级边界框与类别信息。数据分布涵盖多样化的食品类别,图像分辨率与尺寸差异体现了真实场景的复杂性。验证集与测试集的平衡设计为模型性能评估提供了可靠基准,而高达2TB的原始数据规模则充分满足了深度学习模型训练的需求。
使用方法
研究者可通过加载标准化的图像和标注文件快速开展食品检测与分类实验。数据集已预分割为训练、验证和测试集,支持端到端的模型开发流程。对于物体检测任务,可直接调用边界框坐标和类别标签;若进行图像分类,则可利用图像级标签。数据集的HuggingFace集成接口允许用户通过标准API高效访问,显著降低了计算机视觉研究的工程门槛。
背景与挑战
背景概述
food_recognition_2022_processed数据集是2022年推出的面向食品识别领域的大规模视觉数据集,由专业研究机构构建以推动计算机视觉在食品分析中的应用。该数据集包含超过3.7万张标注图像,涵盖丰富的食品类别,每张图像均提供边界框标注和类别标签,为食品检测与识别任务提供了高质量基准数据。其构建反映了深度学习时代对细粒度食品识别技术的迫切需求,在智能餐饮、健康管理等领域具有重要应用价值。
当前挑战
该数据集面临的核心挑战体现在两个方面:在领域问题层面,食品识别需克服类内差异大、类间相似性高等难题,特别是处理不同烹饪方式导致的形态变化;在构建过程中,标注工作面临食品边界模糊、遮挡物干扰等困难,确保标注一致性和完整性需要复杂的质量控制机制。多尺度食品呈现和光线条件变化进一步增加了数据采集与标注的复杂度。
常用场景
经典使用场景
在计算机视觉领域,food_recognition_2022_processed数据集为食品识别任务提供了丰富的图像样本和标注信息。该数据集广泛应用于深度学习模型的训练和评估,特别是在多类别食品检测和分类任务中。研究人员利用其高质量的图像和精确的边界框标注,开发出能够准确识别不同食品种类的算法,为智能餐饮和健康管理提供了技术支持。
实际应用
该数据集的实际应用场景广泛,涵盖了智能餐饮系统、健康管理应用和食品物流管理等多个领域。例如,在智能餐饮系统中,基于该数据集训练的模型可以自动识别用户餐盘中的食品种类和分量,为用户提供个性化的营养分析和饮食建议。此外,食品物流管理中的自动化分拣系统也受益于该数据集的高精度识别能力。
衍生相关工作
food_recognition_2022_processed数据集催生了一系列经典研究工作,包括基于深度学习的食品检测算法和跨模态食品识别模型。这些研究不仅提升了食品识别的准确率,还探索了食品识别与其他领域的结合,如营养分析和智能推荐系统。部分工作进一步扩展了数据集的应用范围,推动了食品识别技术的实际落地。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作