five

PFAND Classifier Dataset

收藏
github2022-11-21 更新2024-05-31 收录
下载链接:
https://github.com/marcinstopyra/pfand_clf
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含超过650张瓶子/罐子/空槽的顶部视角照片,用于德国Pfand系统的押金价格类别识别。数据集存在偏差,主要包含当地社区流行的饮料瓶照片,且大部分照片由相同设备拍摄,不包含塑料瓶。

This dataset comprises over 650 top-view photographs of bottles, cans, and empty slots, intended for the identification of deposit price categories within the German Pfand system. The dataset exhibits a bias, predominantly featuring images of beverage bottles popular in local communities, with the majority of photographs captured by the same device. Notably, plastic bottles are not included in this collection.
创建时间:
2022-07-21
原始信息汇总

数据集概述

数据集内容

  • 图像数量: 超过650张图片
  • 图像类型: 瓶子/罐子/空槽的顶部视角照片
  • 数据来源: 图片由个人及其朋友收集,主要包含当地社区流行的饮料瓶

数据集特点

  • 偏差: 数据集存在偏差,主要包含当地生产的啤酒和学生喜爱的廉价饮料
  • 设备一致性: 大多数照片使用相同设备拍摄,缺乏多样性
  • 类别缺失: 不包含任何塑料瓶的图片

数据集用途

  • 分类任务: 用于训练和测试一个CNN多类别分类器,识别德国Pfand系统中空瓶的押金价格类别

数据预处理

  • 预处理步骤: 旋转、调整大小、裁剪
  • 预处理工具: dataset_preprocessing_Pfand_clf.ipynb笔记本中的代码

数据标注

  • 标注方式: 手动标注,使用GitHub用户Dida-do开发的标注工具

CNN分类器

  • 模型结构: 包含数据增强子模型,使用随机翻转、随机旋转和随机缩放
  • 训练细节: 模型参数通过随机搜索优化,使用3折交叉验证
  • 最终模型参数:
    • 过滤器数量: [32, 64, 128, 256, 512]
    • 激活函数: relu
    • 批量大小: 32
    • 无dropout层
  • 训练结果: 训练在28个epoch后停止,测试准确率达到0.9781

未来计划

  • 自动标注: 使用半监督学习(KMeans聚类)自动标注新样本
  • 应用开发: 开发一个应用,能够识别并计算混合瓶子/罐子/空槽的总押金价值
  • 应用部署: 将上述程序部署为网络/移动应用
搜集汇总
数据集介绍
main_image_url
构建方式
PFAND Classifier数据集的构建基于德国Pfand系统中的空瓶押金分类任务。数据采集过程中,通过从上方拍摄瓶子、罐子或空槽的照片,共收集了超过650张图像。这些图像经过预处理,包括旋转、调整大小和裁剪,以确保数据的一致性和可用性。数据标注通过手动完成,使用了GitHub用户Dida-do开发的标注工具,并根据项目需求进行了修改。数据集的构建旨在通过鸟瞰视角捕捉瓶子的关键特征,避免模型学习误导性的标签或标志。
特点
PFAND Classifier数据集的特点在于其专注于德国Pfand系统中的空瓶押金分类任务。数据集包含多种瓶子和罐子的图像,涵盖了不同押金价值的类别。然而,数据集存在一定的偏差,主要集中在本地社区流行的饮品,如巴登-符腾堡州的啤酒和学生中流行的廉价品牌。此外,数据集缺乏塑料瓶的图像,且大部分照片由相同设备拍摄。这些特点使得数据集在训练模型时可能面临一定的局限性,但也为研究模型在特定场景下的表现提供了独特的机会。
使用方法
PFAND Classifier数据集的使用方法包括数据预处理、模型训练和测试。数据预处理通过Jupyter Notebook脚本完成,包括图像的旋转、调整大小和裁剪。数据集被划分为训练集和测试集,分别占80%和20%。模型采用卷积神经网络(CNN)架构,并通过随机搜索优化超参数。训练过程中使用了数据增强技术,如随机翻转、旋转和缩放,以提高模型的泛化能力。最终模型的测试准确率达到0.9781,并通过混淆矩阵和错误预测样本的分析进一步验证了模型的性能。
背景与挑战
背景概述
PFAND Classifier Dataset 是一个专注于德国押金系统(Pfand system)中空瓶押金价格分类的多类别图像分类数据集。该数据集由Marcinstopyra及其团队于近期创建,旨在通过卷积神经网络(CNN)识别不同类别瓶罐的押金价格。数据集包含超过650张从顶部拍摄的瓶罐图像,涵盖了不同品牌和类型的饮料容器。尽管数据集规模有限,但其独特的研究视角和实际应用价值使其在图像分类领域具有一定的创新性。数据集的构建基于德国本地社区的饮料消费习惯,主要集中在斯图加特地区流行的啤酒品牌和学生群体中常见的廉价饮料品牌。这一数据集不仅为图像分类研究提供了新的挑战,也为自动化的押金回收系统开发奠定了基础。
当前挑战
PFAND Classifier Dataset 在构建和应用过程中面临多重挑战。首先,数据集的样本存在明显的偏差,主要来源于本地社区的饮料消费习惯,导致模型可能过度依赖特定品牌的设计或标志,而非瓶罐的实际物理特征。其次,数据集缺乏塑料瓶样本,这限制了模型在更广泛场景中的应用能力。此外,数据集的图像采集设备较为单一,可能影响模型的泛化能力。在技术层面,尽管通过顶部拍摄的方式减少了标签对模型的干扰,但如何进一步提升模型的鲁棒性,尤其是在面对不同品牌和类型的瓶罐时,仍是一个亟待解决的问题。最后,数据集的规模相对较小,可能限制了深度学习模型的性能优化空间。
常用场景
经典使用场景
PFAND Classifier Dataset 主要用于训练和测试卷积神经网络(CNN)模型,以识别德国Pfand系统中空瓶的押金价格类别。该数据集包含超过650张从上方拍摄的瓶子、罐子和空槽的照片,适用于多类别分类任务。通过从顶部拍摄的照片,模型能够更好地捕捉瓶子的颈部特征(如封口类型),从而避免因标签设计或品牌标识导致的偏见问题。
实际应用
PFAND Classifier Dataset 的实际应用场景包括自动化的空瓶押金计算系统。例如,在超市或回收站中,可以通过摄像头拍摄装满混合空瓶的箱子,利用训练好的模型对每个槽位进行分类,并自动计算总押金金额。这种应用不仅提高了回收效率,还减少了人工操作的错误率,具有广泛的市场潜力。
衍生相关工作
基于PFAND Classifier Dataset,研究者可以进一步开发半监督学习算法,用于自动标注新样本。此外,该数据集还启发了相关应用程序的开发,例如基于Web或移动端的押金计算工具。这些衍生工作不仅扩展了数据集的应用范围,还为智能回收系统的研究提供了新的方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作