ENF-WHU Dataset

github2024-04-11 更新2024-05-31 收录

下载链接：

https://github.com/ghuawhu/ENF-WHU-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含在武汉大学校园周边收集的ENF-WHU音频录制数据，涵盖教室、校园路径、会议室、研究生办公室、宿舍、图书馆等多个地点，环境多样性包括日夜、晴雨、室内外等。录制设备为普通智能手机和录音机，时长5到20分钟，格式为PCM WAVE，量化深度16位，单声道，采样频率8000 Hz。数据集分为H1和H0两个类别，H1包含130个真实世界录制，捕捉到噪声ENF，H1_ref包含相应的130个参考ENF，H1_ref_one_day包含相应的24小时参考ENF。H0包含10个无捕捉ENF的录制。

This dataset contains ENF-WHU audio recording data collected around the campus of Wuhan University, covering multiple scenarios including classrooms, campus paths, conference rooms, graduate offices, dormitories, libraries, and more. The environmental conditions vary across day/night, sunny/rainy, indoor/outdoor settings, etc. The recordings were made using ordinary smartphones and voice recorders, with each clip having a duration ranging from 5 to 20 minutes. The audio format is PCM WAVE, with 16-bit quantization depth, mono channel, and a sampling rate of 8000 Hz. The dataset is split into two categories: H1 and H0. H1 consists of 130 real-world recordings that capture the ENF noise; H1_ref includes the corresponding 130 reference ENF signals, while H1_ref_one_day provides the corresponding 24-hour reference ENF. H0 contains 10 recordings with no captured ENF.

创建时间：

2020-06-18

原始信息汇总

ENF-WHU 数据集

数据集概述

录制地点： 教室、校园路径、会议室、研究生办公室、宿舍、图书馆。
环境多样性： 白天/夜晚、雨天/晴天、室内/室外。
录制设备： 流行的智能手机和录音机。
录制时长： 5~20 分钟。
格式： PCM WAVE。
量化深度： 16 位。
声道： 单声道。
采样频率： 8000 Hz（参考数据为 400 Hz）。

数据集分类

H1： "001~130.wav"，包含 130 个真实世界录制文件，带有捕捉到的（有噪声的）电网频率（ENF）。
H1_ref： "001_ref~130_ref.wav"，对应的 130 个参考 ENF 文件（无噪声，相同时长），从电力主线上获取。
H1_ref_one_day： 对应 130 个录制文件的一整天（24 小时）参考 ENF。例如，"003-004_ref.wav" 表示 "H1" 文件夹中的 "003.wav" 和 "004.wav" 是在同一天录制的。
H0： "O01~O10.wav"，包含 10 个真实世界录制文件，没有捕捉到的 ENF。"01~40.wav" 是通过随机裁剪这 10 个录制文件得到的 40 个片段。

MATLAB 程序

ENF 检测

clairvoyant 检测器： 假设对 ENF 有完美知识。
- GMF：标准 NP 检测器。
- MF-like 近似：避免未知噪声协方差矩阵的要求。
- 渐近近似：在计算复杂度和检测性能之间进行权衡。
GLRT 检测器： 假设 ENF 未知且确定性。
- LS-LRT：MF-like，未知参数被 MLEs 替换。
- naive-LRT：MF-like，未知 IFs 被名义值替换。
TF 域检测器： 假设 ENF 未知且随机。
- 测试统计量是时间-频率线上最强点的样本方差（例如，STFT + 峰值）。
- 利用 ENF 的慢变特性，因此在 H0 下测试统计量大，在 H1 下小。

ENF 增强和估计

单音模型基础的 ENF 增强方法。
多音谐波模型基础的增强和谐波选择，用于鲁棒 ENF 估计。

引用信息

ENF 检测：
- G. Hua, H. Liao, Q. Wang, H. Zhang, and D. Ye, "Detection of electric network frequency in audio recordings – From theory to practical detectors," IEEE Trans. Inf. Forensics Security, vol. 16, pp. 236–248, 2021.
ENF 增强：
- G. Hua, H. Liao, H. Zhang, D. Ye, and J. Ma, "Robust ENF estimation based on harmonic enhancement and maximum weight clique," IEEE Trans. Inf. Forensics Security, DOI: 10.1109/TIFS.2021.3099697, 2021.
- G. Hua and H. Zhang, "ENF signal enhancement in audio recordings," IEEE Trans. Inf. Forensics Security, vol. 15, pp. 1868-1878, 2020.
相关工作：
- G. Hua, "Error analysis of forensic ENF matching," in Proc. 2018 IEEE International Workshop on Information Forensics and Security (WIFS), pp. 1-7, Hong Kong, Dec. 2018.
- G. Hua, G. Bi, and V. L. L. Thing, "On practical issues of electric network frequency based audio forensics," IEEE Access, vol. 5, pp. 20640-20651, Oct. 2017.
- G. Hua, Y. Zhang, J. Goh, and V. L. L. Thing, "Audio authentication by exploring the absolute error map of the ENF signals," IEEE Trans. Inf. Forensics Security, vol. 11, no. 5, pp. 1003-1016, May 2016.
- G. Hua, J. Goh, and V. L. L. Thing, “A dynamic matching algorithm for audio timestamp identification using the ENF criterion,” IEEE Trans. Inf. Forensics Security, vol. 9, no. 7, pp. 1045-1055, Jul. 2014.

搜集汇总

数据集介绍

构建方式

ENF-WHU数据集的构建基于武汉大学校园内多个场景的音频记录，涵盖教室、校园路径、会议室、研究生办公室、宿舍和图书馆等地点。数据集通过使用流行的智能手机和录音设备，记录了5至20分钟的音频片段，格式为16位单声道PCM WAVE，采样频率为8000 Hz。此外，数据集还包括从电力主线上获取的无噪声参考ENF数据，以及24小时连续的参考ENF数据，用于时间戳匹配的真实性验证。

使用方法

ENF-WHU数据集可用于开发和验证电子网络频率（ENF）检测、增强和估计的算法。用户可以通过提供的MATLAB程序进行ENF检测，包括使用GMF、MF-like近似和渐近近似等方法。此外，数据集还支持ENF增强和估计方法的研究，如单音模型和多音谐波模型。通过使用这些程序和数据，研究人员可以评估不同算法在真实世界录音中的性能，并进行音频取证应用的开发和测试。

背景与挑战

背景概述

ENF-WHU数据集是由武汉大学研究人员在校园及其周边环境中采集的音频数据集，专注于电子网络频率（ENF）检测、增强和鲁棒估计，应用于基于ENF的音频取证领域。该数据集创建于2023年，涵盖了多种环境条件和录音设备，旨在为ENF信号的检测与分析提供丰富的真实世界数据。主要研究人员包括G. Hua、H. Liao等，他们的研究成果已在IEEE Transactions on Information Forensics and Security等权威期刊上发表，显著推动了音频取证技术的发展。

当前挑战

ENF-WHU数据集面临的挑战主要包括：首先，如何在复杂多变的环境中准确检测和提取ENF信号，尤其是在噪声干扰较大的情况下。其次，数据集的构建过程中，如何确保参考数据的准确性和一致性，以便进行有效的匹配和验证。此外，ENF信号的增强和鲁棒估计方法的开发与评估，也是该数据集面临的重要挑战，需要综合考虑计算复杂性与检测性能的平衡。

常用场景

经典使用场景

ENF-WHU数据集在电子网络频率（ENF）检测、增强和鲁棒估计方面具有经典应用场景。该数据集通过在武汉大学校园内不同环境（如教室、校园路径、会议室等）采集的音频数据，提供了丰富的ENF信号样本。研究者可以利用这些数据进行ENF信号的检测与增强算法的研究，特别是在音频取证领域，通过对比噪声环境下的实际录音与无噪声参考数据，验证和优化ENF检测算法的性能。

解决学术问题

ENF-WHU数据集解决了音频取证领域中ENF信号检测与增强的关键学术问题。通过提供多样化的环境录音和对应的参考数据，该数据集帮助研究者开发和验证新的ENF检测算法，如基于最大似然估计（MLE）和加权最大似然估计（WMLE）的多音调模型。这些算法不仅提高了ENF信号的检测精度，还增强了在复杂噪声环境下的鲁棒性，为音频取证提供了更为可靠的技术支持。

实际应用

ENF-WHU数据集在实际应用中主要用于音频取证和时间戳验证。例如，在法律取证中，通过分析录音中的ENF信号，可以验证录音的真实性和时间戳的准确性，从而为案件提供关键证据。此外，该数据集还可用于开发和测试智能音频设备中的时间同步算法，确保设备在不同环境下的时间记录一致性，广泛应用于安全监控、通信设备等领域。

数据集最近研究