five

TPC-268

收藏
github2026-03-27 更新2026-03-28 收录
下载链接:
https://github.com/tiny-smart/TPC-268
下载链接
链接失效反馈
官方服务:
资源简介:
TPC-268是一个大规模的数据集,用于类无关计数(CAC),并明确整合了植物分类学。它旨在解决自然界中视觉计数的独特挑战,具有高度多样化和非刚性的植物形态。数据集包含10,000张图像,涵盖从冠层遥感到组织显微镜的极端观察尺度,以及678,050个实例级点和30,000个示例边界框的注释。数据集还包括完整的7级林奈分类体系,涵盖2个界(植物界和真菌界)、2个门、4个纲、35个目、83个科、192个属和242个物种。

TPC-268 is a large-scale dataset for category-agnostic counting (CAC) that explicitly integrates taxonomic frameworks. It is designed to address the unique challenges of visual counting in natural environments, featuring highly diverse and non-rigid plant morphologies. The dataset contains 10,000 images spanning extreme observation scales from canopy remote sensing to tissue microscopy, with annotations of 678,050 instance-level points and 30,000 bounding boxes. It also includes a complete 7-level Linnaean taxonomy system, covering 2 kingdoms (Plantae and Fungi), 2 phyla, 4 classes, 35 orders, 83 families, 192 genera, and 242 species.
创建时间:
2026-03-22
原始信息汇总

TPC-268 数据集概述

基本信息

  • 数据集名称:TPC-268
  • 论文标题:Plant Taxonomy Meets Plant Counting: A Fine-Grained, Taxonomic Dataset for Counting Hundreds of Plant Species
  • 发表会议:CVPR 2026
  • 作者:Jinyu Xu, Tianqi Hu, Xiaonan Hu, Letian Zhou, Songliang Cao, Meng Zhang, Hao Lu*
  • 官方仓库地址:https://github.com/tiny-smart/TPC-268
  • 论文地址:https://arxiv.org/abs/2603.21229
  • 许可证:Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)

数据集简介

TPC-268 是一个用于类别无关计数(CAC)的大规模数据集,其明确整合了植物分类学信息。该数据集旨在应对自然界视觉计数中因植物形态高度多样且非刚性所带来的独特挑战。

核心构成

  • 图像数量:10,000 张图像,涵盖从冠层遥感观测到组织显微观察的极端观测尺度。
  • 标注信息:包含 678,050 个实例级点标注和 30,000 个范例边界框。
  • 分类学层级:包含完整的 7 级林奈分类层级,涵盖 2 个界(植物界和真菌界)、2 个门、4 个纲、35 个目、83 个科、192 个属和 242 个种。
  • 目标类别:包含 268 个细粒度的“物种-组织”目标,为计数提供精确的语义(例如,花、果实、叶、茎、气孔、树脂)。

数据组织与下载

  • 下载链接
    • 百度网盘:https://pan.baidu.com/s/1pYET_8I7a6mKmdLYCT0O8g?pwd=jjhv
    • Google Drive:https://drive.google.com/file/d/1kLlcuyQ1yKE5-TqRkS4CNRgq0VH-RpKc/view?usp=sharing
  • 目录结构:解压后,图像严格按照其分类学和组织结构组织:TPC-268/[Genus_Species]/[Organization]/[Genus_Species]_[Organization]_[index].jpg

标注文件与数据划分

核心数据文件位于 annotations/splits/ 目录中:

  • annotations/tpc268_annotations.json:实例级点标注和范例的4点坐标。
  • annotations/tpc268_taxonomy_ids.json:从层级分类级别(界到种)到唯一数字ID的映射。
  • annotations/tpc268_taxonomy_vectors.json:每个植物物种的7维分类学特征向量。
  • splits/tpc268_[train|val|test].txt:用于数据加载的相对图像路径列表。
  • splits/tpc268_split.json:划分到训练集、验证集和测试集中的具体物种-组织类别列表。

工具脚本

tools/ 目录提供了必要的工具:

  • tpc268_dataset.py:一个标准化的 PyTorch Dataset 类,用于加载图像和标注。
  • tpc268_visualize_dataset.py:用于在图像上叠加标注的脚本。
  • TPC268_Annotator.html:一个用于在浏览器中直接浏览和编辑标注的 HTML 工具。
  • tpc268_generate_benchmark_split.py:用于生成数据集划分列表的脚本。

基准测试结果

下表报告了在 TPC-268 上的 3-shot 计数性能,最佳性能已加粗显示。其他实验结果请参阅主论文。

Method Backbone Val MAE Val RMSE Val $R^2$ Test MAE Test RMSE Test $R^2$
FamNet R50 28.87 52.51 0.58 30.43 65.62 0.62
BMNet+ R50 29.33 77.78 0.47 27.78 57.25 0.74
C-DETR R50 22.66 77.51 0.75 22.68 57.97 0.74
SPDCNet R18 25.66 72.49 0.52 23.70 47.53 0.64
CountTR Hybrid 20.21 55.82 0.73 25.19 49.94 0.62
SAFECount R18 22.57 63.65 0.64 25.70 52.30 0.58
LOCA R50 17.26 53.19 0.75 17.51 38.37 0.78
DAVE R50 16.47 52.87 0.76 17.61 40.06 0.75
CACVIT ViT-B 16.63 42.49 0.82 22.04 41.79 0.73
CountGD Swin-B 18.32 54.55 0.74 19.52 50.51 0.61
TasselNetV4 ViT-B 13.20 43.93 0.83 22.95 51.36 0.60

引用

如果 TPC-268 对您的研究有帮助,请引用: bibtex @inproceedings{xu2026plant, title={Plant Taxonomy Meets Plant Counting: A Fine-Grained, Taxonomic Dataset for Counting Hundreds of Plant Species}, author={Xu, Jinyu and Hu, Tianqi and Hu, Xiaonan and Zhou, Letian and Cao, Songliang and Zhang, Meng and Lu, Hao}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2026} }

使用许可

TPC-268 数据集仅限学术研究用途发布。它采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。未经明确事先同意,严禁任何商业用途、复制或分发此数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
在植物学与计算机视觉交叉领域,TPC-268数据集的构建体现了对自然世界复杂性的深刻洞察。该数据集通过整合完整的林奈分类体系,涵盖从界到种的七个层级,系统性地收集了涵盖极端观测尺度的上万张图像,包括冠层遥感至组织显微图像。构建过程中,专家对图像进行了精细标注,生成了超过六十七万个实例级点标注和三万个范例边界框,确保了数据在物种与组织器官层面的语义精确性。
特点
TPC-268数据集的核心特征在于其首次将植物分类学与视觉计数任务深度融合。数据集囊括了268个细粒度的“物种-组织”类别,覆盖242个物种,呈现出植物形态的高度多样性与非刚性特点。其独特的层级化分类结构为模型提供了丰富的语义先验,而跨越宏观至微观的观测尺度则模拟了真实世界计数任务的复杂性,为类无关计数研究设立了新的基准。
使用方法
为便利研究者使用,数据集提供了标准化的PyTorch数据加载类与可视化工具。用户可通过提供的分割文件按训练、验证与测试集加载图像与标注,并利用附带的脚本进行数据浏览与结果验证。数据集的层级化目录结构清晰映射了分类学信息,支持直接基于文件路径的语义解析,便于开发能够利用分类学知识的先进计数模型。
背景与挑战
背景概述
在计算机视觉领域,类无关计数任务旨在对任意类别的物体进行数量估计,然而自然场景中植物形态的高度多样性与非刚性结构为这一任务带来了独特挑战。TPC-268数据集由Jinyu Xu、Hao Lu等研究人员于2026年构建,并发表于CVPR会议,其核心研究问题在于将植物分类学知识显式整合到视觉计数框架中,以应对植物物种在器官层面上的精细语义差异。该数据集包含一万张图像,涵盖从冠层遥感至组织显微的极端观测尺度,标注了超过六十七万个实例级点与三万个范例边界框,并构建了完整的七级林奈分类体系,涉及二百六十八个细粒度物种-器官类别。TPC-268的推出为生态监测、农业估产等应用提供了关键数据支撑,推动了类无关计数方法在复杂自然场景中的泛化能力与可解释性。
当前挑战
TPC-268数据集所针对的类无关计数问题,在植物领域面临多重挑战:植物器官形态呈现高度非刚性变化,同一物种在不同生长阶段或环境下外观差异显著;细粒度分类要求模型区分相似物种的微观特征,如花朵、气孔等器官的细微差别;多尺度观测图像从宏观遥感至显微视角,导致目标尺寸与背景复杂度剧烈波动,对计数算法的尺度不变性提出苛刻要求。在数据集构建过程中,挑战同样突出:需在庞大植物分类学体系中确立统一标注标准,确保二百四十二个物种、二百六十八个类别在语义上的一致性与准确性;实例级点标注在密集或遮挡场景下难以精确定位,尤其对于微小或透明结构;跨尺度数据采集与对齐需协调多种成像设备,保证数据在分辨率与色彩空间上的可比性。
常用场景
经典使用场景
在植物学与计算机视觉的交叉领域,TPC-268数据集为类无关计数任务提供了精细化的基准平台。该数据集通过整合完整的林奈分类体系,覆盖了从宏观冠层到微观组织的多尺度观测图像,使得研究人员能够在高度多样化的植物形态背景下,评估和开发先进的视觉计数模型。其经典应用场景集中于探索模型在跨物种、跨组织结构的泛化能力,尤其是在面对非刚性、形态各异的植物目标时,如何实现精准的实例级数量统计。
衍生相关工作
围绕TPC-268数据集,已衍生出一系列经典的计数方法比较与改进研究。例如,LOCA、DAVE、CACVIT等模型在该数据集上的性能评估,揭示了结合视觉Transformer与层次化特征的潜力。这些工作不仅推动了类无关计数算法在复杂自然场景中的演进,也催生了针对植物细粒度识别的多任务学习框架,为后续融合分类学先验知识的计数网络设计提供了重要的启发和基准。
数据集最近研究
最新研究方向
在植物视觉计数领域,TPC-268数据集凭借其精细的物种-组织分类和完整的林奈分类层级,为类无关计数研究开辟了新路径。当前前沿探索聚焦于融合分类学先验知识的多尺度计数模型,旨在应对自然场景中植物形态高度多样与非刚性的挑战。相关热点事件如CVPR 2026的论文发表,推动了跨域迁移学习与少样本计数方法的进展,其影响深远,不仅提升了农业监测、生态调查的自动化水平,更为生物多样性保护提供了精准的数据基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作