five

Oktoberfest Food Dataset

收藏
github2024-01-09 更新2024-05-31 收录
下载链接:
https://github.com/a1302z/OktoberfestFoodDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是在2018年Ingolstadt的Schanzer Almfest期间收集的,用于训练对象检测网络。数据集包含多种食品和饮料的图像,每张图像都标注了边界框和类别信息。数据集主要用于训练和测试对象检测模型,特别是用于计数目的。

This dataset was collected during the 2018 Schanzer Almfest in Ingolstadt and is intended for training object detection networks. It comprises images of various foods and beverages, each annotated with bounding boxes and category information. The dataset is primarily utilized for training and testing object detection models, particularly for counting purposes.
创建时间:
2019-03-27
原始信息汇总

数据集概述

数据集名称

  • Oktoberfest Food Dataset

数据获取

  • 数据集在2018年Ingolstadt的Schanzer Almfest期间收集。

数据集内容

  • dataset:包含训练和测试数据集及其标签。
    • 标签格式:OpenCV风格,记录在files.txt中。
  • models:包含预训练的TensorFlow模型。
  • video_data_zipped:包含原始视频数据,数据集从中提取。

数据集描述

数据分布

Class Id Class Images Annotations average quantity
0 Bier 300 436 1.45
1 Bier Mass 200 299 1.50
2 Weissbier 229 298 1.30
3 Cola 165 210 1.27
4 Wasser 198 284 1.43
5 Curry-Wurst 120 159 1.32
6 Weisswein 81 105 1.30
7 A-Schorle 90 98 1.09
8 Jaegermeister 43 152 3.53
9 Pommes 110 126 1.15
10 Burger 105 122 1.16
11 Williamsbirne 50 121 2.42
12 Alm-Breze 100 114 1.14
13 Brotzeitkorb 65 72 1.11
14 Kaesespaetzle 92 100 1.09

统计信息

  • 包含各类别的图像数量、标注数量及平均数量统计。

基准测试

  • 使用TensorFlow的Object Detection API进行模型训练。
  • 最佳模型:Single Shot Detector (SSD) with Feature Pyramid Networks (FPN)。
  • 评估指标:测试集上的精确度-召回率曲线下的面积。

代码和工具

  • Evaluation:包含评估TensorFlow模型的Jupyter笔记本。
  • Preview:用于测试预训练TensorFlow模型的笔记本。
  • CreateTFRecordFile:用于将数据集转换为TFRecord格式的笔记本。
  • ShowAnnotations:用于可视化数据集标注的Python脚本。

格式转换

  • PASCAL_VOC格式转换由Vitalii Rusinov完成。

作者

  • Alexander Ziller
  • Julius Hansjakob
  • Vitalii Rusinov
搜集汇总
数据集介绍
main_image_url
构建方式
Oktoberfest Food Dataset的构建源于2018年德国因戈尔施塔特的Schanzer Almfest活动,由IlassAG团队采集数据,并在慕尼黑工业大学的数据挖掘与分析实验室进行标注。该数据集的主要任务是通过标注边界框和类别来训练目标检测网络。数据采集过程中,团队对结账场景中的物品进行了详细标注,确保了数据的多样性和实用性。数据集包含训练集和测试集,标注信息以OpenCV风格存储,便于后续的模型训练与评估。
特点
Oktoberfest Food Dataset涵盖了多种典型的德国啤酒节食品和饮品,如啤酒、咖喱香肠、薯条等,共计15个类别。数据集包含1110张图像和2696个标注,每个类别的图像数量和标注分布较为均衡,平均每张图像包含2.43个物品。数据集的特点在于其场景的真实性和标注的精确性,能够有效支持目标检测模型的训练与评估。此外,数据集还提供了预训练的TensorFlow模型,便于用户快速上手。
使用方法
Oktoberfest Food Dataset的使用方法灵活多样,用户可以通过下载数据集中的图像和标注文件进行模型训练。数据集提供了预训练的TensorFlow模型,用户可以通过提供的Jupyter Notebook(如Preview.ipynb)进行模型测试与可视化。此外,数据集还支持转换为TFRecord格式,便于与TensorFlow目标检测库集成。用户还可以使用PASCAL_VOC格式的标注进行模型训练,并通过Google Colaboratory在线训练Faster RCNN和RetinaNet模型。
背景与挑战
背景概述
Oktoberfest Food Dataset是由慕尼黑工业大学(TUM)数据挖掘与分析实验室的Günnemann教授团队于2018年创建的,旨在解决食品检测与计数问题。该数据集在Ingolstadt的Schanzer Almfest活动中采集,包含了多种食品和饮料的标注图像,用于训练目标检测网络。数据集的核心研究问题是通过计算机视觉技术实现对食品的自动识别与计数,从而提升食品销售和库存管理的效率。该数据集在计算机视觉领域具有重要影响力,尤其是在目标检测和图像分类任务中,为相关研究提供了宝贵的数据资源。
当前挑战
Oktoberfest Food Dataset在构建和应用过程中面临多重挑战。首先,食品的多样性和复杂性使得目标检测任务变得尤为困难,尤其是在食品重叠或遮挡的情况下,准确识别和计数成为一大难题。其次,数据集的构建过程中,标注工作耗时且繁琐,需要确保每个食品类别的标注准确无误。此外,数据集的规模相对较小,可能限制了模型的泛化能力,尤其是在面对新场景或新食品类别时。最后,尽管使用了先进的深度学习模型如SSD和FPN进行训练,但在实际应用中,模型的精度和鲁棒性仍需进一步提升,尤其是在复杂背景和光照条件下。
常用场景
经典使用场景
Oktoberfest Food Dataset 在计算机视觉领域中被广泛用于训练和评估目标检测模型。该数据集通过标注食品和饮料的边界框,为研究人员提供了一个丰富的实验平台,特别是在复杂场景下的物体识别和计数任务中。其经典使用场景包括在零售和餐饮行业中自动化结账系统的开发,以及智能监控系统中对特定物品的实时检测。
衍生相关工作
基于 Oktoberfest Food Dataset,研究人员开发了多种经典的目标检测模型,如 Single Shot Detector (SSD) 和 Feature Pyramid Networks (FPN)。这些模型在目标检测任务中表现出色,并推动了相关技术的发展。此外,该数据集还激发了多篇学术论文的发表,进一步丰富了计算机视觉领域的研究成果,并为后续研究提供了重要的参考和基础。
数据集最近研究
最新研究方向
在计算机视觉领域,Oktoberfest Food Dataset作为一款专注于食品检测的数据集,近年来在目标检测和计数任务中展现了其独特的价值。该数据集通过标注啤酒、咖喱香肠等多种食品的边界框,为深度学习模型提供了丰富的训练样本。当前研究热点主要集中在提升模型在复杂场景下的检测精度与鲁棒性,尤其是在高密度物体分布和遮挡情况下的表现。基于该数据集,研究者们已成功应用了多种先进的深度学习架构,如SSD与FPN的结合,显著提升了检测性能。此外,该数据集还被广泛应用于食品消费行为分析、智能零售系统等实际场景,推动了计算机视觉技术在商业领域的深入应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作