WiderPerson

Name: WiderPerson
Creator: 中国科学院自动化研究所
Published: 2019-09-25 10:42:07
License: 暂无描述

arXiv2019-09-25 更新2024-06-21 收录

下载链接：

http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson

下载链接

链接失效反馈

官方服务：

资源简介：

WiderPerson数据集由中国科学院自动化研究所创建，旨在解决现有行人检测数据集在多样性和密度上的不足。该数据集包含13,382张图像，总计399,786个标注，平均每张图像有29.87个标注，涵盖了多种场景和遮挡情况。数据集的创建过程涉及从多个搜索引擎爬取图像，并通过严格的标注流程确保标注质量。WiderPerson数据集适用于评估和提升在复杂环境中行人检测算法的性能，特别是在处理高密度和多样性场景时的能力。

The WiderPerson Dataset was developed by the Institute of Automation, Chinese Academy of Sciences, to address the limitations of existing pedestrian detection datasets in terms of diversity and scene density. This dataset contains 13,382 images with a total of 399,786 annotations, with an average of 29.87 annotations per image, covering a wide range of scenarios and occlusion conditions. The development process of the dataset includes crawling images from multiple search engines, and implementing a rigorous annotation pipeline to guarantee annotation quality. The WiderPerson Dataset is suitable for evaluating and improving the performance of pedestrian detection algorithms in complex environments, particularly their capabilities in handling high-density and diverse scenarios.

提供机构：

中国科学院自动化研究所

创建时间：

2019-09-25

搜集汇总

数据集介绍

构建方式

WiderPerson数据集通过从多个图像搜索引擎（如Google、Bing和Baidu）爬取图像，结合精心设计的50多个关键词（如行人、骑车人、行走、跑步、马拉松、广场舞和集体照），获取了约50,000张候选图像。为确保图像的多样性和避免重复，采用了pHash算法和联合查找机制进行去重处理，并过滤掉人群稀疏的图像，最终保留了13,382张图像。这些图像被随机分为训练集、验证集和测试集，分别包含8,000、1,000和4,382张图像。

特点

WiderPerson数据集的显著特点在于其高密度和丰富的多样性。该数据集包含399,786个标注，平均每张图像有29.87个标注，涵盖了五种精细分类（行人、骑车人、部分可见的人、人群和忽略区域）。这些标注在场景和遮挡方面具有极大的变化，使得行人检测任务极具挑战性。此外，数据集在场景、季节和城市等方面的多样性远超现有数据集，为评估和提升行人检测算法提供了理想的基准。

使用方法

WiderPerson数据集的使用方法包括训练、验证和测试。研究者可以使用公开的训练和验证标注来训练和调优模型，并通过在线基准评估其在测试集上的性能。数据集支持多种评估指标，如平均漏检率（MR），特别适用于评估算法在实际应用中的表现。此外，数据集还提供了详细的错误分析工具，帮助研究者识别和改进模型在复杂场景中的不足。

背景与挑战

背景概述

行人检测作为计算机视觉和模式识别领域的一个长期问题，广泛应用于安全监控、移动机器人、自动驾驶和人群分析等多个领域。随着现有基准数据集的可用性，行人检测取得了显著进展。然而，现实世界需求与当前行人检测基准之间在多样性和密度方面存在差距。大多数现有数据集来自车辆在常规交通场景中的拍摄，导致多样性不足；同时，高度遮挡的行人场景仍然代表性不足，导致密度较低。为了缩小这一差距并促进未来行人检测研究，我们引入了一个名为WiderPerson的大型多样化数据集，用于野外密集行人检测。该数据集包含13,382张图像和399,786个标注，涵盖了广泛的场景和遮挡情况，为评估行人检测器在野外的性能提供了理想的基准。

当前挑战

WiderPerson数据集在构建过程中面临多个挑战。首先，解决领域问题的挑战在于如何提高行人检测在多样性和密度方面的表现，特别是在高度遮挡和复杂场景下的检测能力。其次，构建过程中遇到的挑战包括数据收集的多样性，确保图像来源广泛且代表性强；标注的准确性和一致性，特别是在处理高度遮挡和部分可见行人时；以及数据集的规模和复杂性，确保其能够有效训练和评估现代行人检测算法。此外，数据集的发布和维护也需要克服技术和社会层面的挑战，以确保其长期可用性和影响力。

常用场景

经典使用场景

WiderPerson数据集在密集行人检测领域展现了其经典应用场景。该数据集通过提供多样化的场景和高度遮挡的行人标注，为评估和提升行人检测算法的鲁棒性提供了理想的平台。研究者们利用WiderPerson数据集训练和测试行人检测模型，特别是在处理复杂场景和高密度人群中的行人检测问题时，展现了其独特的优势。

衍生相关工作

WiderPerson数据集的发布催生了一系列相关研究工作，特别是在行人检测和人群分析领域。研究者们基于该数据集提出了多种改进的行人检测算法，如改进的Faster R-CNN和RetinaNet，这些算法在处理高度遮挡和密集行人场景时表现出色。此外，WiderPerson还激发了对行人检测中遮挡问题的深入研究，推动了遮挡感知检测算法的发展。这些工作不仅提升了行人检测的性能，也为其他相关领域如人群计数和行为分析提供了新的思路和方法。

数据集最近研究