UJI Probes
收藏arXiv2023-12-08 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.7801798
下载链接
链接失效反馈官方服务:
资源简介:
UJI Probes是由西班牙海梅一世大学的新成像技术研究所创建的一个公开可用的Wi-Fi探针请求数据集。该数据集包含超过140万条探针请求,捕获自一个月的办公室环境,涵盖工作日、周末和节假日。数据集的创建过程中,通过使用ESP32基嗅探器捕获原始数据包,并采用SHA512哈希算法进行隐私保护。UJI Probes数据集主要用于室内定位和导航研究,旨在评估隐私保护措施的有效性,分析接收信号强度指示器(RSSI)的稳定性,并进行用户存在检测和房间占用估计。
UJI Probes is a publicly available Wi-Fi probe request dataset developed by the Institute of New Imaging Technologies at Jaume I University, Spain. This dataset contains over 1.4 million probe requests captured over a one-month period in an office environment, covering weekdays, weekends, and public holidays. During the dataset construction, raw network packets were captured using ESP32-based sniffers, and privacy protection was implemented via the SHA-512 hashing algorithm. UJI Probes is primarily used for indoor positioning and navigation research, aiming to evaluate the effectiveness of privacy protection measures, analyze the stability of Received Signal Strength Indicator (RSSI), and conduct user presence detection and room occupancy estimation.
提供机构:
新成像技术研究所,海梅一世大学,卡斯特隆,西班牙
创建时间:
2023-07-20
搜集汇总
数据集介绍

构建方式
在室内定位与导航领域,Wi-Fi探测请求作为非加密管理帧,为研究提供了丰富的数据源。UJI Probes数据集的构建依托于ESP32嗅探器,在西班牙哈韦一世大学GEOTEC部门的开放式办公室环境中,进行了为期一个月的连续数据采集。采集过程覆盖了工作日、周末及当地节日,确保了时间维度的完整性。设备配置为全信道扫描模式,捕获了超过140万条探测请求,并同步记录了Radiotap头部信息以保留无线电属性。所有敏感字段均采用SHA512哈希算法进行匿名化处理,既保护用户隐私,又维持了数据的可分析性。
特点
该数据集的核心特点在于其时效性与完整性。采集于2023年3月,反映了当前Wi-Fi设备普遍采用MAC地址随机化技术后的真实环境。数据包含丰富的无线电信息,如接收信号强度指示、信道及天线参数,并附有办公室的无线电地图,为信号传播分析提供空间参考。匿名化处理巧妙保留了MAC地址的功能位与组织唯一标识符,使得随机化与全局唯一地址的区分成为可能。数据集中约35%的请求使用了随机化MAC地址,19%的请求包含特定服务集标识符,揭示了设备行为的多样性。
使用方法
研究人员可通过标准化数据包捕获文件,利用Wireshark或Scapy等工具进行深入分析。数据集适用于多项研究场景,例如评估Wi-Fi信号的长期稳定性,通过接收信号强度指示的时间序列分析设备移动模式。在人员检测与房间占用估计方面,结合无线电地图的接收信号强度指示阈值,可推断设备距离与空间分布。隐私保护研究则能借助匿名化但结构完整的数据,探索随机化MAC地址的重现规律或信息元素中的设备指纹识别漏洞。数据集公开于Zenodo平台,附有ESP32固件,支持自定义数据采集与对比实验。
背景与挑战
背景概述
随着室内定位与导航技术的蓬勃发展,用户隐私保护问题日益凸显。Wi-Fi探测请求作为802.11协议中的管理帧,因其未加密特性,成为研究隐私泄露与设备追踪的关键数据源。UJI Probes数据集由西班牙哈韦一世大学新成像技术研究所、捷克布尔诺理工大学无线电电子学系以及葡萄牙米尼奥大学算法研究中心的科研团队于2023年共同创建,旨在提供一份公开、时效性强的Wi-Fi探测请求数据集。该数据集在一个月内捕获了超过140万条探测请求,涵盖了工作日、周末及节假日,并附有办公室环境的无线电地图。其核心研究问题聚焦于通过最新数据探究探测请求在存在检测、信号稳定性分析及隐私评估等方面的应用,为室内定位、无线通信及隐私保护领域提供了重要的实证基础。
当前挑战
UJI Probes数据集致力于解决Wi-Fi探测请求分析中的多重挑战。在领域问题层面,探测请求的未加密特性使其易于被捕获,但自2014年MAC地址随机化技术推广以来,设备追踪与用户去匿名化变得复杂,数据集需应对随机化地址下的隐私泄露分析、设备指纹识别及时间模式挖掘等难题。在构建过程中,研究团队面临数据采集的完整性挑战,包括确保长达一个月的连续捕获、处理2.4GHz频段限制以及整合无线电信息如RSSI和信道数据。同时,隐私保护要求对敏感字段进行匿名化处理,团队采用SHA512哈希算法在保护用户身份的前提下保留数据分析能力,平衡了隐私与可用性。此外,数据集的构建需克服现有数据集如Sapienza2013的过时性、Glimps2015的信息缺失及Nile2021的时长不足等局限,以提供更全面、更新的研究资源。
常用场景
经典使用场景
在室内定位与导航领域,Wi-Fi探针请求数据集常被用于分析无线信号行为与用户移动模式。UJI Probes数据集通过长达一个月的连续捕获,覆盖工作日、周末及节假日,提供了超过140万条探针请求记录,其经典使用场景包括评估接收信号强度指示器的长期稳定性。研究者可基于该数据集分析同一设备在不同时间段的信号强度变化,揭示环境因素或设备状态对无线传输的影响,为信号建模与定位算法优化提供实证基础。
实际应用
在实际应用中,UJI Probes数据集为智能建筑与办公环境管理提供了重要支撑。基于探针请求的密度与时间分布,可实现人员存在检测与房间占用率估计,辅助能源管理与空间优化。结合附带的无线电地图,数据集还能用于粗略距离估计,提升室内定位系统的精度。这些应用不仅增强了环境感知能力,也为物联网设备部署与无线网络规划提供了数据驱动的决策依据。
衍生相关工作
该数据集衍生了一系列经典研究工作,主要集中在隐私分析与信号处理方向。例如,研究者利用其时间序列数据探索MAC地址随机化的递归模式,揭示了设备跟踪的潜在风险;同时,基于接收信号强度指示器的稳定性分析,促进了被动定位技术的发展。此外,数据集还启发了对探针请求中信息元素的指纹识别方法,为设备分类与行为预测提供了新思路,延续了早期如Sapienza2013等数据集在社交关系推断方面的研究脉络。
以上内容由遇见数据集搜集并总结生成



