five

Egg Quality Dataset

收藏
arXiv2025-10-03 更新2025-10-07 收录
下载链接:
https://github.com/Kenshin-Keeps/Egg_Quality_Prediction_ELMF4EggQ
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由孟加拉国达卡地区收集的288个棕色蛋壳鸡蛋组成,涵盖了四个不同的市场类别:批发市场、超市、杂货店和开放式商店。数据集包含了鸡蛋的外部图像、形状指数和重量数据,以及通过实验室内部质量测量确定的鸡蛋等级和新鲜度水平。该数据集旨在用于训练和评估模型,以预测鸡蛋的新鲜度和质量等级,并支持基于计算机视觉的鸡蛋质量评估的未来应用。

This dataset comprises 288 brown-shelled eggs collected from the Dhaka region of Bangladesh, covering four distinct market categories: wholesale markets, supermarkets, grocery stores, and open shops. It includes external images of the eggs, shape index and weight data, as well as egg grades and freshness levels determined via in-laboratory quality measurements. This dataset is designed for training and evaluating models to predict egg freshness and quality grades, and to support future computer vision-based applications for egg quality assessment.
提供机构:
Bangladesh Army University of Science and Technology, Charles Sturt University, Sher-e-Bangla Agricultural University
创建时间:
2025-10-03
搜集汇总
数据集介绍
main_image_url
构建方式
在禽蛋品质检测领域,Egg Quality Dataset的构建采用了严谨的实验室标准化流程。研究团队从孟加拉国达卡的四种不同市场渠道分层采集了288枚褐壳鸡蛋,通过模拟真实供应链环境引入样本多样性。所有鸡蛋在受控光照条件下使用固定相机拍摄外部图像,并同步记录重量和形状指数。内部品质参数通过破坏性实验室测量获得,其中蛋黄指数采用数显卡尺和千分尺精确测量蛋黄高度与直径比值,哈夫单位则基于蛋重和浓厚蛋白高度计算。最终数据集经过质量控制筛选,保留186个有效样本,并依据蛋黄指数和哈夫单位阈值将原始多分类标签简化为二元分级体系。
特点
该数据集的核心价值在于首次实现了外部特征与内部品质的跨模态关联。其独特之处在于同步包含鸡蛋的外部图像、物理测量值(重量与形状指数)以及经专家验证的内部品质标签(基于蛋黄指数的鲜度分级和哈夫单位的品质分级)。数据集通过分层抽样覆盖批发市场、超市、杂货店和露天商铺四种典型流通场景,有效捕捉了真实市场环境下的品质变异。特别值得注意的是,样本在规律时间间隔下采集,自然形成了鲜度梯度分布,为时间序列分析提供了可能。所有图像数据均在标准化拍摄条件下获取,确保了视觉特征的一致性。
使用方法
该数据集适用于多模态机器学习研究,特别是计算机视觉与传统特征融合的交叉领域。使用者可分别提取图像特征(通过预训练的ResNet152、DenseNet169等卷积神经网络)和数值特征(重量与形状指数),采用特征级联方式构建多模态输入。为应对类别不均衡问题,建议采用SMOTE过采样技术进行数据增强,并通过主成分分析降低特征维度。在模型构建阶段,可基于梯度提升树、支持向量机等基础分类器开发集成学习框架,利用多数投票机制提升预测鲁棒性。数据集支持双任务学习,既可分别进行品质分级与鲜度预测,也可探索多任务联合优化方案。
背景与挑战
背景概述
Egg Quality Dataset 是由孟加拉国多所高校研究人员于2025年创建的创新数据集,旨在推动禽蛋质量无损评估技术的发展。该数据集包含186枚褐壳鸡蛋的外部图像与结构特征数据,并通过实验室专业测量获取了基于哈夫单位和蛋黄指数的内部质量标签。作为首个结合外部视觉特征与内部生物指标的开源鸡蛋质量数据集,它为食品质量检测领域提供了重要的基准数据,推动了计算机视觉在农产品品质监控中的应用。
当前挑战
该数据集致力于解决禽蛋品质无损评估中的核心难题:如何通过外部特征准确预测内部新鲜度与等级。构建过程中面临多重挑战:需在有限样本量下通过分层采样覆盖不同市场来源的鸡蛋变异;需建立标准化图像采集流程以消除光照与角度干扰;同时需通过精密仪器测量易受环境影响的蛋黄指数与哈夫单位,确保标签可靠性。这些挑战凸显了多模态数据融合与小型数据集建模在农业应用中的复杂性。
常用场景
经典使用场景
在禽蛋品质检测领域,Egg Quality Dataset通过融合外部图像特征与结构参数,构建了多模态机器学习评估体系。该数据集最典型的应用场景在于训练集成学习框架,通过卷积神经网络提取蛋壳表面纹理、颜色等视觉特征,结合形状指数与重量数据,实现对鸡蛋等级与新鲜度的无损分类。这种多源信息融合策略显著提升了商业禽蛋分拣流水线的自动化水平,为传统人工检测提供了可靠的替代方案。
解决学术问题
该数据集有效解决了禽蛋品质评估中外部特征与内部参数关联性研究的学术空白。通过建立蛋壳外观与哈氏单位、蛋黄指数的定量映射关系,验证了计算机视觉在非破坏性检测中的可行性。其多模态特征融合方法突破了单一数据源的局限性,为食品质量无损检测领域提供了新的研究范式,推动了机器学习在农产品品质分析中的理论创新与应用边界拓展。
衍生相关工作
该数据集催生了系列基于多模态学习的禽蛋检测研究,如结合热成像技术的新鲜度预测模型、基于注意力机制的缺陷检测算法等衍生工作。其公开的标注数据促进了迁移学习在农业视觉任务中的应用探索,启发了针对不同蛋壳颜色的跨品种适应性研究。相关成果进一步拓展至禽类健康监测、孵化率预测等关联领域,形成了以蛋品质量为核心的交叉研究生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作