khaclinh/pp4av

Name: khaclinh/pp4av
Creator: khaclinh
Published: 2022-10-26 04:19:10
License: 暂无描述

Hugging Face2022-10-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/khaclinh/pp4av

下载链接

链接失效反馈

官方服务：

资源简介：

PP4AV是第一个公开的包含人脸和车牌标注的驾驶场景数据集。该数据集提供了3,447张标注了人脸和车牌的驾驶图像。对于普通摄像头数据，数据集从安装在移动车辆上的摄像头拍摄的现有视频中采样，这些车辆在欧洲城市中行驶。PP4AV中的图像从欧洲六个城市的不同时间段采样，包括夜间。该数据集还使用了WoodScape数据集中的鱼眼图像，从前、后、左、右摄像头中选取了244张鱼眼图像。PP4AV数据集可用作自动驾驶数据匿名化模型的基准测试套件。

PP4AV is the first publicly available driving scene dataset annotated for both human faces and license plates. It provides 3,447 annotated driving images with corresponding facial and license plate labels. For standard camera data, the dataset is sampled from existing videos captured by cameras mounted on moving vehicles traveling across European cities. Images in PP4AV are collected across different time periods, including nighttime, from six European cities. Additionally, the dataset includes 244 fisheye images selected from front, rear, left and right cameras of the WoodScape dataset. The PP4AV dataset can serve as a benchmark suite for autonomous driving data anonymization models.

提供机构：

khaclinh

原始信息汇总

数据集概述

数据集基本信息

名称: PP4AV
语言: 英语
许可证: CC BY-NC-ND 4.0
多语言性: 单语种
大小: 1K<n<10K
任务类别: 目标检测
任务ID: 人脸检测
标签: 车牌检测

数据集创建

源数据

数据来源: 从6个欧洲城市的现有视频中采样，包括巴黎、荷兰、瑞士、苏黎世、斯图加特和斯特拉斯堡。
数据类型: 正常摄像头数据和鱼眼摄像头数据。
数据量: 总共3,447张图片。

标注

标注过程: 由专家团队使用CVAT工具进行标注，包括人脸和车牌的标注。
标注质量控制: 采用两阶段标注和审核流程，通过IoU评分确保标注的准确性。

数据集结构

数据实例

组成: 每个数据点包含一张图片及其对应的人脸和车牌标注。
标注格式: 使用YOLO v1.1格式，每个标注包含对象类别、中心点坐标、宽度和高度。

数据字段

图像: PIL图像对象。
对象: 包含人脸和车牌的边界框信息。

使用数据注意事项

许可证: 数据集遵循CC BY-NC-ND 4.0许可证，限制了商业使用和衍生作品的创建。

附加信息

基准模型: 提供了预训练的基准模型和演示。
数据集维护者: Linh Trinh。
引用信息: 提供了详细的引用格式。

搜集汇总

数据集介绍

构建方式

在自动驾驶技术迅猛发展的背景下，隐私保护成为关键议题。PP4AV数据集的构建过程体现了严谨的学术方法，其源数据主要来自欧洲六个城市（如巴黎、海牙、苏黎世等）的行车记录视频，以及WoodScape数据集中的鱼眼图像。研究团队从这些视频中精心采样了3447张图像，涵盖了日间与夜间等多种驾驶场景。标注工作由专业团队通过CVAT工具完成，采用了两阶段独立标注与合并的流程，并基于IoU阈值进行冲突消解，确保了人脸与车牌边界框标注的高精度与一致性。

特点

作为首个专注于自动驾驶场景下隐私保护任务的公开基准数据集，PP4AV的突出特点在于其场景的多样性与标注的专精性。数据集不仅包含了常规视角图像，还引入了鱼眼相机数据，以模拟真实车辆的多摄像头环境。所有图像均附带精细的人脸与车牌边界框标注，标注对象涵盖了不同尺寸、肤色、遮挡情况以及多国车牌类型，具有高度的现实复杂性。这种设计使得该数据集能够有效支持数据匿名化模型在复杂驾驶环境中的鲁棒性评估。

使用方法

该数据集主要服务于计算机视觉领域，特别是自动驾驶中的目标检测与隐私保护研究。使用者可通过Hugging Face平台加载数据集，其数据结构清晰，图像与对应的YOLO v1.1格式标注文件分别存放。研究人员可利用该数据集训练或评估人脸与车牌检测模型，亦或作为基准测试套件，衡量数据匿名化算法在保护个人身份信息（如模糊人脸和车牌）方面的性能。数据遵循CC BY-NC-ND 4.0许可，适用于非商业性的学术研究。

背景与挑战

背景概述

在自动驾驶技术迅猛发展的背景下，数据隐私保护成为亟待解决的核心议题。PP4AV数据集由研究人员Linh Trinh及其团队于2022年创建，旨在为自动驾驶场景中的隐私保护模型提供首个公开的基准评估套件。该数据集专注于人脸与车牌检测任务，涵盖了来自欧洲六个城市的3447张驾驶图像，包括日间与夜间场景，并整合了鱼眼镜头数据。其构建基于现有行车视频与WoodScape等公开数据集，通过专家标注团队进行精细化处理，为自动驾驶系统的匿名化算法研究奠定了关键数据基础，推动了该领域从单纯感知向隐私敏感计算的范式演进。

当前挑战

PP4AV数据集致力于解决自动驾驶中隐私敏感目标的检测难题，其核心挑战在于复杂动态环境下目标的多变性与遮挡问题。人脸与车牌在车辆运动、光照变化及不同视角下呈现尺度、姿态与清晰度的显著差异，尤其是夜间或鱼眼畸变条件下的检测精度提升尤为困难。在数据构建过程中，团队面临标注一致性与质量控制的挑战，需通过多轮独立标注与冲突消解机制来确保边界框的准确性。此外，数据源来自多样化的城市环境与不同采集设备，在格式统一与场景代表性平衡方面亦需精细考量，以保障数据集的可靠性与泛化能力。

常用场景

经典使用场景

在自动驾驶领域，隐私保护已成为技术部署的关键考量。PP4AV数据集作为首个公开的驾驶场景人脸与车牌标注数据集，其经典使用场景聚焦于评估数据匿名化模型的性能。该数据集通过涵盖欧洲多个城市、不同时段及鱼眼相机图像，为研究者提供了丰富的真实驾驶环境样本，从而能够系统性地测试模型在复杂光照、多样交通条件下的匿名化效果，成为自动驾驶隐私保护技术的重要基准测试平台。

解决学术问题

PP4AV数据集针对自动驾驶研究中隐私保护评估标准缺失的学术问题，提供了系统性的解决方案。它通过精确标注的人脸与车牌边界框，解决了以往研究中因缺乏统一、高质量标注数据而难以量化比较不同匿名化算法性能的困境。该数据集的意义在于建立了可重复的评估框架，推动了隐私保护技术在计算机视觉与自动驾驶交叉领域的标准化研究，为后续学术探索奠定了数据基础。

衍生相关工作

围绕PP4AV数据集，已衍生出一系列专注于自动驾驶隐私保护的经典研究工作。例如，基于该数据集基准测试的匿名化模型比较研究，深入分析了不同神经网络架构在复杂场景下的性能差异。同时，一些工作探索了联合检测与匿名化的端到端框架，或利用生成对抗网络进行更自然的隐私信息替换。这些研究共同推动了高效、鲁棒的实时匿名化算法的发展，丰富了自动驾驶安全与隐私的研究图谱。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集