five

Cocoa Pollinators Dataset

收藏
arXiv2024-12-28 更新2025-01-01 收录
下载链接:
http://datadryad.org/stash/share/CAxX5xrwbdzlEyfW1MSR7FcNVE_H6wl29YJTuzWdyYA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Cocoa Pollinators Dataset,由浙江大学和西湖大学的研究团队创建,旨在通过深度学习技术识别可可花的访客昆虫。数据集包含5792张昆虫图像和1082张背景图像,总数据量为6874条,来源于中国海南兴隆热带植物园的可可种植园。数据通过嵌入式摄像头在两年内采集,经过筛选和标注后用于训练YOLOv8模型。该数据集的应用领域包括智能农业和生物多样性监测,旨在通过监测可可花的访客昆虫来提升可可的可持续生产。

This dataset, named Cocoa Pollinators Dataset, was created by a research team from Zhejiang University and Westlake University. It aims to identify visiting insects of cocoa flowers using deep learning technologies. The dataset contains 5,792 insect images and 1,082 background images, with a total of 6,874 data samples, collected from cocoa plantations in the Xinglong Tropical Botanical Garden, Hainan, China. The data was collected over two years using embedded cameras, and after screening and annotation, it is used for training YOLOv8 models. The application fields of this dataset include smart agriculture and biodiversity monitoring, with the goal of improving sustainable cocoa production by monitoring the visiting insects of cocoa flowers.
提供机构:
浙江大学环境与资源学院, 西湖大学可持续农业系统与工程实验室
创建时间:
2024-12-28
搜集汇总
数据集介绍
main_image_url
构建方式
Cocoa Pollinators Dataset的构建基于嵌入式摄像头在海南可可种植园中长达两年的数据采集,共收集了2300万张图像。通过帧差分和斑点检测技术,摄像头自动捕捉花朵上的活动并存储检测事件。随后,研究人员手动筛选了804万张图像,识别出包含可可花访客的图像,并使用YOLOv8模型进行自动标注和人工校正。最终数据集包含5792张昆虫图像和1082张背景图像,涵盖了Ceratopogonidae、Formicidae、Aphididae、Araneae和Encyrtidae等五类常见可可花访客。
特点
该数据集的特点在于其多样性和复杂性。它不仅包含了五种常见的可可花访客图像,还涵盖了不同光照条件和背景下的花朵图像,尤其是低对比度和复杂背景的图像。数据集的构建过程中,研究人员通过逐步增加背景图像比例来优化模型性能,最终确定了8%的背景图像比例能够显著提升模型的检测精度。此外,数据集还通过图像增强技术进行了扩展,进一步提高了模型的泛化能力。
使用方法
Cocoa Pollinators Dataset主要用于训练和评估深度学习模型,特别是YOLOv8等目标检测模型。研究人员通过将数据集分为训练集、验证集和测试集,逐步优化模型性能。在模型训练过程中,采用了图像增强技术,如水平翻转、垂直翻转、图像平移和亮度调整,以增加数据的多样性。最终,研究人员通过评估模型的精确度、召回率、F1分数和mAP等指标,确定了中等规模的YOLOv8模型在8%背景图像比例下表现最佳。该数据集的应用有助于推动可可种植中的授粉监测和可持续农业发展。
背景与挑战
背景概述
Cocoa Pollinators Dataset 是由浙江大学、西湖大学等机构的研究团队于2023年创建的,旨在通过深度学习技术识别可可花访客,提升可可产量。该数据集包含5,792张昆虫图像和1,082张背景图像,涵盖了Ceratopogonidae、Formicidae、Aphididae、Araneae和Encyrtidae等五类常见可可花访客。这些数据通过在中国海南可可种植园中部署的嵌入式摄像头,历时两年收集了2300万张图像后精心筛选而成。该数据集的发布为可可种植中的传粉监测提供了重要支持,推动了可持续农业和生物多样性保护的研究。
当前挑战
Cocoa Pollinators Dataset 在构建和应用过程中面临多重挑战。首先,可可花访客的低频访问导致大量图像中缺乏目标昆虫,增加了数据筛选的难度。其次,夜间监控所需的红外照明使得图像对比度低,目标昆虫的识别更加复杂。此外,数据标注过程耗时且昂贵,尤其是在处理大量低质量图像时。在模型训练方面,如何平衡背景图像的比例以优化检测性能也是一个关键问题。尽管YOLOv8模型在中等规模下表现最佳,但模型在不同环境下的泛化能力仍需进一步提升,以减少误报率并提高检测精度。
常用场景
经典使用场景
Cocoa Pollinators Dataset 在农业生态学领域中被广泛用于研究可可花的传粉者行为及其对产量的影响。通过深度学习模型,该数据集能够识别和分类可可花上的昆虫访客,如蚊蚋、蚂蚁、蚜虫、蜘蛛和寄生蜂等。这一数据集为研究者提供了丰富的图像数据,帮助分析不同传粉者的活动频率及其对可可产量的贡献。
衍生相关工作
该数据集衍生了一系列相关研究,特别是在农业智能化和生物多样性监测领域。例如,基于该数据集的研究推动了YOLOv8模型在复杂农业环境中的应用优化,进一步提升了昆虫检测的准确性和效率。此外,该数据集还为其他作物的传粉者监测提供了参考,推动了智能农业技术的广泛应用。
数据集最近研究
最新研究方向
在农业智能化与生物多样性监测领域,Cocoa Pollinators Dataset的推出标志着可可授粉研究迈入了一个新阶段。该数据集通过深度学习技术,特别是YOLOv8模型的应用,为可可花访客的自动识别提供了强有力的工具。研究显示,中等规模的YOLOv8模型在包含8%背景图像的训练集上表现最佳,F1得分为0.71,mAP50为0.70。这一成果不仅提升了模型在低对比度图像和复杂背景下的检测能力,还为可持续可可生产提供了科学依据。未来,该数据集的应用将推动农业智能化的发展,特别是在精准农业和生态系统服务监测方面,具有重要的实践意义和广阔的应用前景。
相关研究论文
  • 1
    Identifying Cocoa Pollinators: A Deep Learning Dataset浙江大学环境与资源学院, 西湖大学可持续农业系统与工程实验室 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作