BRIAR数据集
收藏arXiv2022-11-03 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2211.01917v1
下载链接
链接失效反馈官方服务:
资源简介:
BRIAR数据集是由橡树岭国家实验室创建的一个大型多模态生物识别数据集,旨在支持在极端挑战条件下的生物识别技术研发。该数据集包含超过35万张静态图像和1300多小时的视频,涉及约1000名对象。数据收集使用了多种相机,包括尼康DSLR相机、商用监控相机和无人机平台。数据集的目标是支持开发能够在长达1000米的距离和高角度仰角下准确识别人的算法。BRIAR数据集的应用领域包括高级安全、法医和军事应用,旨在解决现有数据集在这些领域的局限性。
The BRIAR Dataset is a large-scale multimodal biometric dataset created by Oak Ridge National Laboratory, aiming to support the research and development of biometric technologies under extreme challenging conditions. It contains over 350,000 static images and more than 1,300 hours of video, involving approximately 1,000 subjects. Data was collected using a variety of cameras, including Nikon DSLR cameras, commercial surveillance cameras, and unmanned aerial vehicle (UAV) platforms. The goal of this dataset is to support the development of algorithms that can accurately identify individuals at distances up to 1,000 meters and at high elevation angles. Application fields of the BRIAR Dataset include advanced security, forensics, and military applications, aiming to address the limitations of existing datasets in these areas.
提供机构:
橡树岭国家实验室
创建时间:
2022-11-03
搜集汇总
数据集介绍

构建方式
BRIAR数据集的构建方式涉及了多模态生物识别数据的收集和整理,旨在为极端条件下生物识别技术的研究与发展提供支持。数据收集采用了尼康单反相机、商用监控摄像头、专业的长距离研发相机以及第一和第二组无人机平台。数据收集过程中,研究人员在室内和半受控的现场环境下,通过多角度、多距离的拍摄,收集了超过35万张静态图像和超过1300小时的视频片段,涵盖了约1000名受试者。此外,BRIAR数据集还包含了来自无人机的面部和全身视频片段,拍摄高度可达400米,以模拟实际应用场景中的极端条件。
特点
BRIAR数据集的特点在于其涵盖了多种挑战性的成像条件,包括极端距离(100米至1000米)、低分辨率、高仰角以及多样化的地点和天气条件。此外,该数据集还包含了高质量的特写图像和受大气条件(如湍流、降雨、阴影)影响的可变质量的非约束视频。视频质量从10米内的4K分辨率到1000米内的高清分辨率不等,并包含了合作和非合作行为的表现。这些独特的特点使得BRIAR数据集成为推动人脸和全身检测与识别以及人员跟踪与重识别领域研究的重要资源。
使用方法
使用BRIAR数据集的方法包括数据分割、元数据记录和标注。数据首先被分为BRIAR研究集和BRIAR测试集,并在种族、年龄、性别、体重指数和身高上进行分层划分。元数据以标准化生物识别XML格式记录,包含媒体本身的详细信息、受试者的背景信息以及传感器细节。视频元数据还包括自动和手动标注,用于定位受试者的面部和全身,并计算检测到的面部的偏航角和俯仰角。通过这些方法,BRIAR数据集为研究人员提供了用于训练和评估生物识别算法的丰富数据资源。
背景与挑战
背景概述
生物识别技术在国家安全、犯罪预防、反恐、军事和边境安全等领域发挥着重要作用。然而,现有的生物识别算法在极端距离和高度角等复杂条件下往往表现不佳。为了解决这一挑战,美国橡树岭国家实验室的BRIAR项目应运而生。该项目旨在建立一个大规模的多模态生物识别数据集,用于研究和开发在极端条件下准确识别人员的算法。BRIAR数据集包含了超过35万张静态图像和超过1300小时的录像,涵盖了大约1000名受试者。这些数据是通过使用尼康单反相机、各种商用监控相机、专用长距研发相机以及第一组和第二组无人机平台收集的。BRIAR数据集的独特之处在于它包含了从多个距离和高度拍摄的受试者的图像和视频,这些数据对于推动面部、步态和全身生物识别技术的研究至关重要。
当前挑战
BRIAR数据集面临着一些挑战,包括:1) 极端距离和高度角的图像识别:随着与受试者距离的增加,可用于形成面部模板的像素数量减少,这给面部识别带来了挑战。2) 大气扰动的处理:天气条件下的大气扰动会进一步增加图像的挑战性。3) 人群多样性:招募具有理想人口分布的受试者是一个挑战,因为收集地点的地理和人口因素限制了受试者的多样性。4) 数据收集的复杂性:收集过程中可能会遇到设备故障、网络不一致、恶劣天气和人为错误等问题。5) 无人机平台的操作:无人机平台在电池更换、维护和恶劣天气条件下可能存在操作困难。6) 数据标注的准确性:由于分辨率、极端角度、距离和天气条件,自动标注方法可能无法完全准确。为了解决这些问题,BRIAR项目计划在未来几年内进行更多的大型数据收集活动,并在不同的美国地区进行,以增加数据集的多样性和复杂性。
常用场景
经典使用场景
BRIAR数据集,作为首个专门针对极端条件下的生物识别技术研发的大型多模态生物识别数据集,其主要应用场景包括高级安全、法医鉴定和军事应用。该数据集包含超过35万张静止图像和超过1300小时的视频片段,涉及约1000名受试者。这些数据来源于多种相机,包括尼康单反相机、商用监控相机、专业长距离研发相机以及第一组和第二组无人机平台。BRIAR数据集的目标是支持开发能够在高达1000米的距离和高达50°的角度下准确识别人员的算法。
解决学术问题
BRIAR数据集解决了现有生物识别数据集在极端条件下应用的局限性。传统数据集通常包含从新闻网站或社交媒体平台抓取的图像,在高级安全、法医鉴定和军事应用中效用有限。BRIAR数据集通过提供低分辨率、长距离和高角度的图像和视频数据,为研究人员提供了在极端条件下测试和开发生物识别算法的机会。此外,BRIAR数据集还支持全身识别的研究,使用步态和人体测量学方法,进一步拓展了生物识别技术的应用范围。
衍生相关工作
BRIAR数据集的衍生工作包括但不限于基于步态和人体测量学的全身识别研究,以及基于BRIAR数据集训练的高性能人脸识别和全身识别模型。这些衍生工作进一步推动了生物识别技术在极端条件下的应用,并为相关领域的研究提供了新的方向和数据支持。此外,BRIAR数据集的发布还促进了相关领域的研究合作和交流,推动了生物识别技术的发展。
以上内容由遇见数据集搜集并总结生成



