Urdu Deepfake Audio Dataset
收藏Urdu Deepfake Audio Dataset
概述
该数据集是针对乌尔都语的深度伪造音频数据集,由ACL 2024论文《Deepfake Defense: Constructing and Evaluating a Specialized Urdu Deepfake Audio Dataset》引入。数据集专注于两种欺骗攻击——Tacotron和VITS TTS,并包含真实的音频样本进行比较。数据集的构建确保了音素覆盖和平衡,适合用于训练乌尔都语的深度伪造检测模型。
数据集统计
数据集包含以下四个部分:
- Bonafide Part 1
- Bonafide Part 2
- Tacotron
- VITS TTS
各部分的统计数据如下:
| 指标 | Bonafide Part 1 | Bonafide Part 2 | Tacotron | VITS TTS |
|---|---|---|---|---|
| 总时长(分钟) | 1,302.66 | 1,271.65 | 1,061.96 | 1,340.79 |
| 最大样本时长(分钟) | 112.42 | 120.75 | 80.34 | 111.01 |
| 最小样本时长(分钟) | 61.73 | 56.45 | 44.64 | 65.53 |
| 平均样本时长(分钟) | 76.63 | 74.80 | 62.47 | 78.87 |
| 每个说话人的文件数 | 708个音频文件 | 495个音频文件 | 495个音频文件 | 495个音频文件 |
结构
数据集按文件夹组织,每个文件夹包含相应部分的音频文件。文件夹名称根据其部分命名(例如,Bonafide_Part1、Tacotron等)。
使用
数据集可通过以下链接在Huggingface上获取:
- Huggingface Dataset: https://huggingface.co/datasets/CSALT/deepfake_detection_dataset_urdu
引用
@inproceedings{sheza-etal-2024-deepfake, title = "Deepfake Defense: Constructing and Evaluating a Specialized Urdu Deepfake Audio Dataset", author = "Sheza Munir, Wassay Sajjad, Mukeet Raza, Emaan Mujahid Abbas, Abdul Hameed Azeemi, Ihsan Ayyub Qazi, and Agha Ali Raza", booktitle = "Findings of the Association for Computational Linguistics: ACL 2024", year = "2024", publisher = "Association for Computational Linguistics", }
法律
数据集在HuggingFace和Google Drive上托管的数据采用CC BY-NC 4.0许可证。




