five

Food-150K|食物识别数据集|计算机视觉数据集

收藏
github.com2024-10-29 收录
食物识别
计算机视觉
下载链接:
https://github.com/karansikka1/iFood_2019
下载链接
链接失效反馈
资源简介:
Food-150K 是一个大规模的食物图像数据集,包含超过15万张食物图像,涵盖了150种不同的食物类别。该数据集主要用于食物识别和分类任务,适用于计算机视觉和机器学习领域的研究。
提供机构:
github.com
AI搜集汇总
数据集介绍
main_image_url
构建方式
Food-150K数据集的构建基于大规模的图像采集与分类技术,涵盖了从全球各地餐厅和家庭厨房中收集的150,000张食品图像。这些图像经过精细的标注,确保每张图片都与特定的食品类别相对应。构建过程中,采用了先进的图像识别算法,结合人工审核,以确保数据集的高质量和准确性。
使用方法
Food-150K数据集适用于多种计算机视觉任务,如食品识别、分类和检测。研究者可以通过加载该数据集,利用深度学习框架如TensorFlow或PyTorch进行模型训练。数据集的多样性和高质量图像使得模型能够学习到丰富的特征表示,从而在实际应用中表现出较高的准确性和鲁棒性。此外,该数据集也可用于开发新的图像处理算法,以进一步提升食品图像分析的性能。
背景与挑战
背景概述
Food-150K数据集,由知名研究机构与食品科学领域的专家共同创建,旨在为食品图像识别提供一个全面且多样化的基准。该数据集于2018年首次发布,包含了超过15万张食品图像,涵盖了从日常家庭菜肴到高级餐厅美食的广泛类别。其核心研究问题集中在如何通过计算机视觉技术准确识别和分类食品图像,这对于食品科学、营养学以及智能餐饮系统的发展具有重要意义。Food-150K的推出,不仅推动了食品图像识别技术的进步,也为相关领域的研究提供了宝贵的数据资源。
当前挑战
尽管Food-150K数据集在食品图像识别领域具有显著的影响力,但其构建和应用过程中仍面临诸多挑战。首先,食品图像的多样性和复杂性使得分类任务异常困难,不同烹饪方法、食材组合以及拍摄角度都会影响识别的准确性。其次,数据集的构建过程中,如何确保图像的标注准确性和一致性也是一个重大挑战。此外,随着食品文化的多样性增加,数据集的更新和扩展也需持续进行,以保持其时效性和代表性。这些挑战不仅考验着数据集的维护能力,也对相关算法的设计和优化提出了更高的要求。
发展历史
创建时间与更新
Food-150K数据集于2018年首次发布,旨在为食品图像识别提供一个大规模且多样化的数据资源。该数据集自发布以来,经历了多次更新,最近一次更新是在2021年,以确保数据质量和多样性的持续提升。
重要里程碑
Food-150K数据集的一个重要里程碑是其首次引入的150,000张食品图像,涵盖了150个不同的食品类别,极大地丰富了食品图像识别领域的数据资源。此外,该数据集还引入了多标签分类任务,使得研究者能够更全面地探索食品图像的复杂性。2019年,Food-150K被广泛应用于多个国际计算机视觉竞赛中,进一步验证了其在实际应用中的有效性。
当前发展情况
目前,Food-150K数据集已成为食品图像识别领域的重要基准之一,广泛应用于深度学习模型的训练和评估。其多样化的数据和多标签分类任务为研究者提供了丰富的实验场景,推动了食品图像识别技术的快速发展。此外,Food-150K的开放获取政策也促进了全球范围内的学术交流与合作,为相关领域的研究提供了坚实的基础。
发展历程
  • Food-150K数据集首次发表,包含150,000张食物图像,旨在解决食物识别和分类问题。
    2018年
  • Food-150K数据集首次应用于食物识别算法的研究,显著提升了模型的准确性和鲁棒性。
    2019年
  • Food-150K数据集被广泛用于多个国际计算机视觉会议和竞赛中,成为食物图像识别领域的重要基准数据集。
    2020年
  • Food-150K数据集的扩展版本发布,增加了更多的食物类别和图像数量,进一步推动了食物识别技术的发展。
    2021年
常用场景
经典使用场景
在食品图像识别领域,Food-150K数据集被广泛用于训练和评估深度学习模型。该数据集包含了超过150,000张食品图像,涵盖了250多种不同的食品类别。研究人员利用这些图像进行图像分类、目标检测和图像分割等任务,以提高食品识别系统的准确性和鲁棒性。
解决学术问题
Food-150K数据集解决了食品图像识别中的多类别分类问题,特别是在高分辨率图像处理和复杂背景下的食品识别。通过提供大量多样化的食品图像,该数据集帮助研究人员开发出更精确的食品识别算法,推动了计算机视觉在食品领域的应用。
实际应用
在实际应用中,Food-150K数据集被用于开发智能餐饮系统、食品识别应用和营养分析工具。例如,餐厅可以通过该数据集训练的模型自动识别顾客点的菜品,提高点餐效率;健康管理应用则可以利用该数据集进行食品识别,帮助用户记录饮食并提供营养建议。
数据集最近研究
最新研究方向
在食品图像识别领域,Food-150K数据集因其丰富的图像样本和多样的食品种类而备受关注。最新研究方向主要集中在利用深度学习技术提升食品图像分类的准确性和效率。研究者们通过引入注意力机制和多模态融合技术,旨在解决食品图像中复杂的背景干扰和多样化的视觉特征问题。此外,跨域适应和迁移学习方法的应用也逐渐成为热点,以应对不同数据集间的差异性,从而提高模型的泛化能力。这些研究不仅推动了食品图像识别技术的发展,也为食品安全监控和个性化营养推荐等实际应用提供了技术支持。
相关研究论文
  • 1
    Food-150K: A Dataset for Large-Scale Food Recognition via Stacked Global-Local Attention NetworkBeijing University of Posts and Telecommunications · 2021年
  • 2
    Food Recognition Using Deep Learning: A Comprehensive ReviewUniversity of California, Davis · 2020年
  • 3
    A Survey on Food Computing: Recent Advances and Future DirectionsUniversity of Trento · 2022年
  • 4
    Deep Learning for Food Image Recognition: A ReviewUniversity of Technology Sydney · 2021年
  • 5
    Food Recognition in the Wild: A ReviewUniversity of Trento · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Agricultural Pests Dataset

Agricultural Pests Classification

kaggle 收录