five

PAC-105和PAC-Somalia

收藏
arXiv2025-09-25 更新2025-09-27 收录
下载链接:
https://github.com/tiny-smart/tasselnetv4
下载链接
链接失效反馈
官方服务:
资源简介:
PAC-105数据集包含2,646张图像和来自64种植物的105个可计数植物类别,涵盖了各种生长阶段的形态多样的植物。PAC-Somalia数据集包含来自索马里的32种独特植物的1,542张图像。这些数据集旨在促进未来植物计数研究,为跨场景、跨尺度和跨物种植物计数提供全面基准。

The PAC-105 dataset comprises 2,646 images and 105 countable plant categories across 64 plant species, covering morphologically diverse plants at various growth stages. The PAC-Somalia dataset contains 1,542 images of 32 unique plant species from Somalia. These datasets are designed to facilitate future plant counting research and provide comprehensive benchmarks for cross-scene, cross-scale, and cross-species plant counting tasks.
提供机构:
华中科技大学人工智能与自动化学院多光谱信息智能处理技术国家重点实验室
创建时间:
2025-09-25
原始信息汇总

TasselNetV4 数据集概述

数据集简介

TasselNetV4 是论文《TasselNetV4: A vision foundation model for cross-scene, cross-scale, and cross-species plant counting》的官方实现代码库。

核心特性

  • 植物无关计数:面向植物领域定制的新型任务,强调跨植物物种的零样本泛化能力
  • PAC-105和PAC-Somalia数据集:包含两个具有挑战性的PAC数据集,用于训练和评估日常及分布外植物物种
  • TasselNetV4模型:TasselNet植物计数模型的扩展版本

数据集内容

PAC-Somalia数据集

  • 下载地址
    • 百度网盘:https://pan.baidu.com/s/1UH0rihsMe06_5J8AtALTeg?pwd=jssy
    • Google Drive:https://drive.google.com/file/d/1-haH0eZdpcOK9IMGkw0UafWq_YioHIyn/view?usp=drive_link
  • 文件大小:208M
  • 目录结构

/PAC_Somalia ├──── aska ├──── aska_fruit ├──── images ├──── image1.png └──── ... └──── labels └──── aska.csv ├──── boocbooc ├──── ...... ├──── yicib └──── dataset.csv

模型性能

PAC-105数据集性能对比

3-shot设置:

  • TasselNetV4在MAE(16.04)、RMSE(28.03)、WCA(0.74)、R²(0.92)和FPS(121.62)指标上均达到最优

1-shot设置:

  • TasselNetV4在MAE(18.04±0.339)、RMSE(32.04±1.213)、WCA(0.71±0.005)、R²(0.90±0.009)和MPE(0.02±0.000)指标上均达到最优

PAC-Somalia数据集性能对比

3-shot设置:

  • TasselNetV4在MAE(8.88)、RMSE(13.11)、WCA(0.72)和R²(0.87)指标上均达到最优

1-shot设置:

  • TasselNetV4在MAE(10.98±0.065)、RMSE(16.73±0.150)、WCA(0.65±0.000)和R²(0.80±0.005)指标上均达到最优

模型下载

  • 下载地址
    • 百度网盘:https://pan.baidu.com/s/1B71m2TDmClENOevlTUxC1w?pwd=qdgr
    • Google Drive:https://drive.google.com/file/d/1vrHBv8c1PFJjOX_IXPe0K0oXYNkY7a__/view?usp=drive_link
  • 文件大小:1.05G

许可证

  • 本项目采用Apache 2.0许可证
搜集汇总
数据集介绍
main_image_url
构建方式
在植物表型分析领域,PAC-105数据集通过系统化采集策略构建而成,涵盖64个植物物种的105个可计数类别。数据来源整合了公开植物检测数据集、分类数据集及互联网开源图像,确保物种多样性与场景覆盖度。采用VGG Image Annotator工具进行标注,每个实例以中心点标记,并为每张图像随机选取三个边界框作为示例样本。数据集按植物类别划分为训练集(65类)与测试集(40类),严格保持类别互斥以验证模型泛化能力。
特点
该数据集的核心价值体现在其多维度的挑战性设计。PAC-105包含2,646张图像,覆盖谷物作物、观赏植物、蔬菜水果等多元物种,并囊括整株、幼苗、果实、叶片等器官级计数目标。其突出特点在于高强度的类内差异:同一物种在不同生长阶段呈现形态变异,不同栽培品种间存在表型分化,且成像条件涵盖遥感航拍、手持设备及实验室微观尺度。这种多样性通过天气条件、空间密度和观测视角的差异化组合,精准模拟了农业实际场景的复杂性。
使用方法
作为植物无关计数任务的基准数据集,PAC-105支持少样本学习范式下的模型评估。使用者需提供目标植物的示例边界框,模型据此实现跨物种计数推理。数据集支持1-shot和3-shot两种评估模式,通过均方误差(MAE)、决定系数(R²)等指标量化计数精度。特别适用于验证模型在复杂背景、尺度变化及遮挡场景下的鲁棒性,其标注格式与FSC-147数据集兼容,便于跨领域方法迁移。数据集的异分布测试集设计还可用于评估模型在未见过植物类别上的零样本泛化能力。
背景与挑战
背景概述
植物计数作为农业表型分析的关键技术,在作物产量预测、生长监测等领域具有重要价值。PAC-105和PAC-Somalia数据集由华中科技大学多谱信息智能处理技术全国重点实验室于2025年构建,旨在解决传统植物计数模型依赖特定物种的局限性。该数据集涵盖105个植物器官类别、64个物种的2646张图像,以及索马里地区32个特有物种的1542张图像,首次将类无关计数理念引入植物领域,推动了跨场景、跨尺度、跨物种的植物计数研究范式转变。
当前挑战
植物类无关计数面临双重挑战:在领域层面,植物非刚性结构导致形态随生长阶段和环境动态变化,使得传统基于刚性物体的类无关计数模型难以捕捉其高类内差异;在构建层面,数据集需平衡物种多样性(如PAC-105覆盖谷物、果蔬等)与场景复杂性(如遥感图像与野外采集),同时应对索马里地区数据稀缺性和标注一致性难题。此外,植物器官尺度差异(如穗粒与叶片)要求模型具备多尺度自适应能力,而跨物种泛化需克服形态特征的高度异构性。
常用场景
经典使用场景
在植物表型分析领域,PAC-105和PAC-Somalia数据集为植物通用计数研究提供了关键支撑。该数据集通过涵盖64个植物物种的105个可计数类别,构建了跨场景、跨尺度和跨物种的评估基准。其经典应用场景体现在模型仅需少量样本即可实现对新物种的零样本计数,例如给定三个标注框作为示例,模型便能准确统计田间图像中不同生长阶段的作物器官数量。这种设计突破了传统方法对特定物种的依赖,为农业智能监测提供了标准化解决方案。
衍生相关工作
围绕该数据集衍生的经典工作包括TasselNet系列模型的持续演进。TasselNetV4首次将局部计数思想与视觉Transformer结合,提出多分支尺度感知计数器架构;CACViT框架则开创了“提取-匹配”一体化的注意力机制。后续研究如SPDCNet通过可变形卷积嵌入尺度先验,CountTR探索了Transformer在通用计数中的潜力。这些工作共同构建了植物计数领域的理论基础,并推动了FSC-147等通用计数数据集的算法迁移研究。
数据集最近研究
最新研究方向
植物通用计数(PAC)作为计算机视觉领域类无关计数技术的重要延伸,近年来在农业表型分析中引发广泛关注。针对植物非刚性结构、生长阶段动态变化及种内形态差异等特性,研究重点已从单一物种计数模型转向跨场景、跨尺度、跨物种的通用计数框架。TasselNetV4通过融合视觉Transformer与多分支框感知局部计数机制,在PAC-105和PAC-Somalia数据集上实现了对64种植物、105个器官类别的精准计数,其注意力解耦架构与动态尺度适配策略显著提升了模型在遥感影像与田间复杂环境中的鲁棒性。这一突破为高通量植物表型监测提供了可扩展的技术基础,推动了数字农业向标准化、自动化方向的演进。
相关研究论文
  • 1
    TasselNetV4: A vision foundation model for cross-scene, cross-scale, and cross-species plant counting华中科技大学人工智能与自动化学院多光谱信息智能处理技术国家重点实验室 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作