five

LTN dataset

收藏
arXiv2026-03-17 更新2026-03-19 收录
下载链接:
https://huggingface.co/spaces/dAISYTUIlmenau/Nesting_Aids_Detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由伊尔梅瑙理工大学等机构联合创建,包含712张层叠陷阱巢(LTN)图像,用于监测蜜蜂和黄蜂的繁殖活动。数据集涵盖了28个细粒度类别,描述了繁殖细胞的分类学信息和状态,如幼虫、孵化、死亡等。数据收集自德国布伦瑞克和弗莱堡的多个项目,通过部分标注策略(每类最多300个标签)显著减少了标注工作量。该数据集旨在支持基于深度学习的生态监测研究,解决传统人工分类效率低下的问题,并为生物多样性保护提供自动化工具。

This dataset was co-created by institutions including Technische Universität Ilmenau and other organizations. It contains 712 Layered Trap Nests (LTN) images for monitoring the breeding activities of bees and wasps. The dataset covers 28 fine-grained categories that describe the taxonomic information and developmental states of brood cells, such as larva, hatching, mortality, and others. The data was collected from multiple projects in Braunschweig and Freiburg, Germany. A partial annotation strategy (up to 300 labels per category) was applied to significantly reduce the annotation workload. This dataset aims to support deep learning-based ecological monitoring research, address the inefficiency of traditional manual classification, and provide automated tools for biodiversity conservation.
提供机构:
伊尔梅瑙理工大学; 弗莱堡大学; 耶拿大学; 尤利乌斯·库恩研究所·蜜蜂保护研究所; 德国综合生物多样性研究中心
创建时间:
2026-03-17
搜集汇总
数据集介绍
main_image_url
构建方式
在生态监测领域,层叠式陷阱巢(LTN)为研究野生蜂类和黄蜂的种群动态提供了非侵入性观察手段。该数据集的构建基于德国布伦瑞克和弗赖堡两地于2021至2023年间部署的LTN监测项目,共采集了712张独特巢穴图像。图像使用配备微距镜头的数码相机拍摄,记录了巢穴内密集排列的育雏室。标注过程通过LabelStudio平台进行,人工绘制边界框并赋予分类标签,涵盖28个细粒度类别,包括物种分类(如Osmia bicornis)及育雏室状态(如幼虫、死亡)。为平衡标注工作量与类别覆盖,训练集中每类最多标注300个样本,其余样本保持未标注状态,从而在保证模型训练效果的同时显著降低了人力成本。
特点
该数据集在生态监测研究中展现出鲜明的特点。其图像内容呈现高度密集的育雏室分布,且类别分布存在显著不平衡,常见物种的样本数量远多于稀有物种。数据集包含28个细粒度类别,不仅涵盖物种层面的分类,还整合了育雏室发育状态(如幼虫、预蛹、死亡)等多维信息,反映了自然环境中物种丰度与发育阶段的真实变异。此外,数据集中部分类别样本被有意设为未标注,以模拟实际监测中标注资源有限的场景,为研究标注效率与模型性能的平衡提供了实验基础。
使用方法
该数据集主要用于支持基于深度学习的对象检测研究,特别是在生态监测中处理类别不平衡与标注成本问题。研究人员可将其划分为训练、验证与测试子集,利用YOLO等检测架构进行育雏室的定位与分类。数据集中未标注的多数类别样本可通过提出的约束假阳性损失(CFPL)策略进行处理,该策略动态屏蔽未标注区域的预测,避免其对分类损失产生干扰。使用者可通过公开的演示平台进行模型测试,或将数据集用于开发更高效的标注减少方法,以推动大规模生态监测的自动化进程。
背景与挑战
背景概述
层式陷阱巢(LTN)数据集由德国多所研究机构于2026年联合创建,旨在支持对洞巢野生蜂类及黄蜂的生态监测与保护研究。随着全球昆虫生物量下降与传粉者多样性危机日益严峻,传统人工评估巢穴内容的方法效率低下,难以支撑大规模长期监测。该数据集包含712张LTN图像,涵盖28个细粒度类别,记录了蜂室分类学信息与发育状态,为深度学习技术在生态学领域的应用提供了关键数据基础,推动了自动化、非侵入式昆虫监测方法的发展,对生物多样性研究与自然保护实践具有重要科学价值。
当前挑战
该数据集致力于解决生态监测中蜂室检测与分类的自动化难题,其核心挑战在于图像中蜂室排列密集、视觉特征相似度高,且类别分布呈现显著不平衡。常见物种样本数量远超稀有物种,导致模型训练易受多数类主导,难以准确识别少数类。数据构建过程中,密集巢穴结构使得标注工作极为耗时,全面标注所有样本需投入巨大人力。为平衡标注成本与数据完整性,研究采用部分标注策略,但未标注样本在训练中易被误判为背景,干扰模型性能,这要求开发新颖的损失函数以有效利用不完整标注数据,同时缓解类别不平衡带来的模型偏差。
常用场景
经典使用场景
在生态监测领域,层叠式陷阱巢(LTN)数据集为研究腔巢野生蜂与黄蜂的种群动态提供了关键视觉数据。该数据集最经典的应用场景在于支持基于深度学习的对象检测模型,特别是YOLO架构,对巢室图像中的育雏细胞进行自动化识别与分类。通过标注的边界框与物种发育状态标签,研究者能够训练模型在密集巢室图像中精准定位不同类别的育雏细胞,从而显著减少传统人工评估所需的时间与人力成本,为大规模生物多样性监测提供高效技术方案。
实际应用
在实际应用中,LTN数据集支撑的自动化检测系统已被整合于公民科学项目与长期生态监测计划中。例如,在德国的野生蜂监测网络中,该技术帮助研究人员与公民科学家通过非破坏性图像分析,快速评估陷阱巢内的物种丰富度、发育状态及寄生情况。系统能够实时识别常见物种如Osmia bicornis的育雏细胞,并初步判断其发育阶段(如幼虫、预蛹),从而为栖息地保护决策、农药残留影响评估以及种群趋势分析提供即时数据支持,显著提升了监测效率与覆盖范围。
衍生相关工作
围绕LTN数据集,已衍生出多项聚焦于生态监测中深度学习应用的经典研究工作。例如,基于该数据集提出的约束性假阳性损失(CFPL)方法被进一步拓展至其他长尾分布的自然场景对象检测任务中。同时,相关研究借鉴其部分标注策略,开发了针对昆虫巢穴的细粒度分类模型,并结合DNA条形码等分子数据验证视觉检测结果的准确性。这些工作不仅深化了自动化生态监测的技术体系,也为生物多样性保护中的大规模数据采集与智能分析奠定了方法论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作