anindyamondal/Omnicount-191
收藏数据集概述
名称: OmniCount-191
描述: OmniCount-191 是一个创新的数据集,包含多标签对象计数,涵盖点、边界框和VQA注释。该数据集包含30,230张图像,跨越191个多样化的类别,如厨房用具、办公用品、车辆和动物。每个图像的对象实例数从1到160不等,平均计数为10。
数据集详情
创建者: Anindya Mondal, Sauradip Nag, Xiatian Zhu, Anjan Dutta
许可: OpenRAIL
数据来源: 数据集由13名成员手动从网络上根据相关关键词如“航拍图像”、“超市货架”、“家用水果”和“许多鸟类和动物”收集,共有40,000张图像被考虑,最终选择了30,230张图像。
数据处理: 图像选择标准包括至少五个对象实例、高分辨率、无严重遮挡以及对象尺寸适中。使用Labelbox平台进行标注。
统计信息: 数据集包含30,230张图像,平均尺寸为700×580像素,每张图像平均包含10个对象,总计302,300个对象。数据集分为训练和测试集,训练集包含118个类别,测试集包含73个类别,比例为60%-40%。
用途: 主要用于对象计数。
限制用途: 不适用于视觉问答(VQA)和对象检测(OD)。
数据集分割
分割详情: 数据集为零样本和少样本学习条件准备了专门的分割。训练集包含26,978张图像,测试集包含3,252张图像。
引用信息
BibTeX:
@article{mondal2024omnicount, title={OmniCount: Multi-label Object Counting with Semantic-Geometric Priors}, author={Mondal, Anindya and Nag, Sauradip and Zhu, Xiatian and Dutta, Anjan}, journal={arXiv preprint arXiv:2403.05435}, year={2024} }




