five

ChineseFoodNet

收藏
arXiv2017-10-16 更新2024-06-21 收录
下载链接:
https://sites.google.com/view/chinesefoodnet/
下载链接
链接失效反馈
官方服务:
资源简介:
ChineseFoodNet是一个大规模的中餐图像数据集,由美的新兴技术中心创建,旨在自动识别中餐菜品。该数据集包含185,628张图像,涵盖208个中餐类别,图像来源于网络和真实世界,具有多样化的展示方式。创建过程中,采用了半监督方法加速标签过程,减少人工成本。数据集广泛应用于计算机视觉任务,特别是在中餐识别领域,旨在解决中餐图像识别的挑战,如复杂背景和多样化的烹饪方法。

ChineseFoodNet is a large-scale Chinese cuisine image dataset developed by Midea Emerging Technology Center for automated Chinese dish recognition. This dataset comprises 185,628 images spanning 208 categories of Chinese cuisine, with images collected from both the Internet and real-world scenarios, exhibiting diverse presentation styles. During the dataset construction, a semi-supervised method was employed to speed up the labeling procedure and cut down labor costs. Widely utilized in computer vision tasks, particularly in the domain of Chinese food recognition, this dataset aims to tackle the challenges inherent in Chinese food image recognition, such as complex backgrounds and varied cooking techniques.
提供机构:
美的新兴技术中心
创建时间:
2017-05-08
搜集汇总
数据集介绍
main_image_url
构建方式
ChineseFoodNet数据集的构建过程涉及多个步骤。首先,从互联网上收集了约250个食品类别,并通过调查补充了搜索引擎中未包含的流行食品。随后,从社交媒体和实际拍摄中收集了超过50万张食品图片。在数据清洗和标注阶段,通过去除不规则尺寸、无内容和重复的图片,并利用熵值去除无信息图片。对于已标注的图片,直接提取标签;对于未标注的图片,利用元数据信息进行筛选,并通过预训练的CNN模型进行半监督学习,最后由人工验证标签。
特点
ChineseFoodNet数据集包含185,628张图片,涵盖208个食品类别,是目前规模最大、最全面的视觉中国食品识别数据集。数据集的图片来源广泛,包括网络图片和真实环境下的拍摄图片,能够反映真实世界中的食品图片分布。此外,数据集还包含了丰富的元数据信息,可用于进一步的研究和应用。
使用方法
ChineseFoodNet数据集可用于训练和评估视觉食品识别模型。研究人员可以使用PyTorch等深度学习框架进行实验,利用数据集中的训练集、验证集和测试集进行模型的训练和评估。同时,数据集还提供了多个预训练的CNN模型,可供研究人员参考和使用。此外,数据集还提出了一种名为'TastyNet'的数据融合方法,可以进一步提高模型的识别准确率。
背景与挑战
背景概述
饮食是人类生活的重要组成部分,而饮食行为对健康的影响日益受到关注。随着近年来人们拍照分享美食成为一种日常习惯,自动识别菜肴图片的研究领域应运而生。然而,现有的大多数食物图像数据集都是从菜谱图片或自拍中收集的,缺乏足够的大规模和高质量的中国食物图像数据集。为了推动视觉食物分类和相关计算机视觉任务的发展,研究人员构建了一个名为ChineseFoodNet的大规模中国食物图像数据集。该数据集包含超过18.5万个食物照片,涵盖208个类别,包括网络菜谱和菜单图片以及真实菜肴的照片。ChineseFoodNet数据集的创建旨在为深度学习等数据驱动技术提供必要的资源,以训练复杂的食物识别模型,并在相关领域产生了重要影响。
当前挑战
ChineseFoodNet数据集的构建过程中面临了诸多挑战。首先,中国食物种类繁多,不同菜品的图片外观差异很大,即使是人类视觉也很难识别。其次,中国食物图片的噪声难以建模,因为它们是在各种环境和复杂背景下拍摄的,例如昏暗的光线、蒸汽环境、强烈的反射以及各种餐具的颜色、形状和装饰等。为了解决这些挑战,研究人员采取了一系列措施,包括使用半监督学习方法加速数据标注过程,利用元数据过滤有用图像,并使用浅层CNN模型进行分类。此外,为了提高识别准确率,研究人员还提出了一种名为TastyNet的两步数据融合方法,该方法结合了不同CNN模型的预测结果,并通过投票方法获得最终结果。实验结果表明,TastyNet方法在ChineseFoodNet数据集上取得了优异的性能。
常用场景
经典使用场景
ChineseFoodNet数据集广泛应用于中式菜品识别领域,其经典使用场景包括但不限于计算机辅助膳食评估、食物偏好实验、卡路里测量以及营养平衡估计等。该数据集包含超过18万张图片,涵盖208个菜品类别,为深度学习模型提供了丰富的训练数据。通过使用该数据集,研究者能够训练出具有较高识别精度的模型,从而在日常生活中辅助用户记录饮食活动,实现饮食健康管理的智能化。此外,ChineseFoodNet数据集还支持菜品图像检索和推荐系统,为用户提供个性化的饮食建议。
解决学术问题
ChineseFoodNet数据集的建立解决了中式菜品识别领域中数据集规模小、质量不高的问题。该数据集包含大量来自用户日常生活的真实菜品图片,涵盖了不同烹饪风格和菜品呈现形式,使得模型能够在更加接近真实场景的情况下进行训练。此外,ChineseFoodNet数据集还提出了一个新颖的两步数据融合方法,即TastyNet,该方法通过结合不同CNN模型的预测结果,提高了菜品识别的准确性。这一创新方法为中式菜品识别领域的研究提供了新的思路和方法。
衍生相关工作
ChineseFoodNet数据集的建立促进了中式菜品识别领域的研究进展,衍生出许多相关的经典工作。例如,研究者基于ChineseFoodNet数据集训练出了具有较高识别精度的中式菜品识别模型,并将其应用于实际场景中,如智能饮食管理、菜品推荐系统等。此外,TastyNet数据融合方法也在其他领域得到了应用,如人脸识别、物体检测等,为相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作