Oktoberfest Food Dataset

github2024-01-09 更新2024-05-31 收录

下载链接：

https://github.com/a1302z/OktoberfestFoodDataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是在2018年Ingolstadt的Schanzer Almfest期间收集的，用于训练对象检测网络。数据集包含多种食品和饮料的图像，每张图像都标注了边界框和类别信息。数据集主要用于训练和测试对象检测模型，特别是用于计数目的。

This dataset was collected during the 2018 Schanzer Almfest in Ingolstadt and is intended for training object detection networks. It comprises images of various foods and beverages, each annotated with bounding boxes and category information. The dataset is primarily utilized for training and testing object detection models, particularly for counting purposes.

创建时间：

2019-03-27

原始信息汇总

数据集概述

数据集名称

Oktoberfest Food Dataset

数据获取

数据集在2018年Ingolstadt的Schanzer Almfest期间收集。

数据集内容

dataset：包含训练和测试数据集及其标签。
- 标签格式：OpenCV风格，记录在files.txt中。
models：包含预训练的TensorFlow模型。
video_data_zipped：包含原始视频数据，数据集从中提取。

数据集描述

数据分布

Class Id	Class	Images	Annotations	average quantity
0	Bier	300	436	1.45
1	Bier Mass	200	299	1.50
2	Weissbier	229	298	1.30
3	Cola	165	210	1.27
4	Wasser	198	284	1.43
5	Curry-Wurst	120	159	1.32
6	Weisswein	81	105	1.30
7	A-Schorle	90	98	1.09
8	Jaegermeister	43	152	3.53
9	Pommes	110	126	1.15
10	Burger	105	122	1.16
11	Williamsbirne	50	121	2.42
12	Alm-Breze	100	114	1.14
13	Brotzeitkorb	65	72	1.11
14	Kaesespaetzle	92	100	1.09

统计信息

包含各类别的图像数量、标注数量及平均数量统计。

基准测试

使用TensorFlow的Object Detection API进行模型训练。
最佳模型：Single Shot Detector (SSD) with Feature Pyramid Networks (FPN)。
评估指标：测试集上的精确度-召回率曲线下的面积。

代码和工具

Evaluation：包含评估TensorFlow模型的Jupyter笔记本。
Preview：用于测试预训练TensorFlow模型的笔记本。
CreateTFRecordFile：用于将数据集转换为TFRecord格式的笔记本。
ShowAnnotations：用于可视化数据集标注的Python脚本。

格式转换

PASCAL_VOC格式转换由Vitalii Rusinov完成。

作者

Alexander Ziller
Julius Hansjakob
Vitalii Rusinov

搜集汇总

数据集介绍

构建方式

Oktoberfest Food Dataset的构建源于2018年德国因戈尔施塔特的Schanzer Almfest活动，由IlassAG团队采集数据，并在慕尼黑工业大学的数据挖掘与分析实验室进行标注。该数据集的主要任务是通过标注边界框和类别来训练目标检测网络。数据采集过程中，团队对结账场景中的物品进行了详细标注，确保了数据的多样性和实用性。数据集包含训练集和测试集，标注信息以OpenCV风格存储，便于后续的模型训练与评估。

特点

Oktoberfest Food Dataset涵盖了多种典型的德国啤酒节食品和饮品，如啤酒、咖喱香肠、薯条等，共计15个类别。数据集包含1110张图像和2696个标注，每个类别的图像数量和标注分布较为均衡，平均每张图像包含2.43个物品。数据集的特点在于其场景的真实性和标注的精确性，能够有效支持目标检测模型的训练与评估。此外，数据集还提供了预训练的TensorFlow模型，便于用户快速上手。

使用方法

Oktoberfest Food Dataset的使用方法灵活多样，用户可以通过下载数据集中的图像和标注文件进行模型训练。数据集提供了预训练的TensorFlow模型，用户可以通过提供的Jupyter Notebook（如Preview.ipynb）进行模型测试与可视化。此外，数据集还支持转换为TFRecord格式，便于与TensorFlow目标检测库集成。用户还可以使用PASCAL_VOC格式的标注进行模型训练，并通过Google Colaboratory在线训练Faster RCNN和RetinaNet模型。

背景与挑战

背景概述

Oktoberfest Food Dataset是由慕尼黑工业大学（TUM）数据挖掘与分析实验室的Günnemann教授团队于2018年创建的，旨在解决食品检测与计数问题。该数据集在Ingolstadt的Schanzer Almfest活动中采集，包含了多种食品和饮料的标注图像，用于训练目标检测网络。数据集的核心研究问题是通过计算机视觉技术实现对食品的自动识别与计数，从而提升食品销售和库存管理的效率。该数据集在计算机视觉领域具有重要影响力，尤其是在目标检测和图像分类任务中，为相关研究提供了宝贵的数据资源。

当前挑战

Oktoberfest Food Dataset在构建和应用过程中面临多重挑战。首先，食品的多样性和复杂性使得目标检测任务变得尤为困难，尤其是在食品重叠或遮挡的情况下，准确识别和计数成为一大难题。其次，数据集的构建过程中，标注工作耗时且繁琐，需要确保每个食品类别的标注准确无误。此外，数据集的规模相对较小，可能限制了模型的泛化能力，尤其是在面对新场景或新食品类别时。最后，尽管使用了先进的深度学习模型如SSD和FPN进行训练，但在实际应用中，模型的精度和鲁棒性仍需进一步提升，尤其是在复杂背景和光照条件下。

常用场景

经典使用场景

Oktoberfest Food Dataset 在计算机视觉领域中被广泛用于训练和评估目标检测模型。该数据集通过标注食品和饮料的边界框，为研究人员提供了一个丰富的实验平台，特别是在复杂场景下的物体识别和计数任务中。其经典使用场景包括在零售和餐饮行业中自动化结账系统的开发，以及智能监控系统中对特定物品的实时检测。

衍生相关工作

基于 Oktoberfest Food Dataset，研究人员开发了多种经典的目标检测模型，如 Single Shot Detector (SSD) 和 Feature Pyramid Networks (FPN)。这些模型在目标检测任务中表现出色，并推动了相关技术的发展。此外，该数据集还激发了多篇学术论文的发表，进一步丰富了计算机视觉领域的研究成果，并为后续研究提供了重要的参考和基础。

数据集最近研究