GBDF
收藏GBDF: Gender Balanced DeepFake Dataset
概述
GBDF数据集是一个公开可用的性别平衡注释的DeepFake数据集,源自FaceForensics++ (FF++)、Celeb-DF和Deeper Forensics-1.0。该数据集包含10,000个真实和伪造视频,使用不同的身份和表情交换DeepFake生成技术生成。数据集包含10,000个视频,其中男性和女性各5000个,真实与伪造视频的比例为1:4。
数据集属性
GBDF数据集使用FF++(c23版本)、Celeb-DF和DeeperForensics-1.0创建,包含10,000个视频,其中男性和女性各5000个。由于现有DeepFake数据集不包含人口统计信息,我们手动为这些数据集标注了性别标签。GBDF数据集中的DeepFake视频使用不同的身份交换(如FaceSwap、FaceSwap-Kowalski、FaceShifter、编码器-解码器风格和端到端面部交换技术)和表情交换(如Face2Face和NeuralTextures)DeepFake生成技术创建。数据集中大多数视频来自高加索人种。真实与伪造视频的比例为1:4。GBDF数据集进一步分为性别平衡和主题独立的训练和测试子集,比例为70:30。
下载
- DeepFake数据集:请访问FF++、Celeb-DF、DeeperForensics-1.0网站并下载数据集。
- 性别注释:GBDF数据集的性别注释存储在releases中,可以下载为xlsx文件。xlsx文件("GBDF_training_labels.xlsx")提供了10,000个视频(男性和女性各5000个)的真实和DeepFake视频的性别注释版本。属性文件包含GBDF训练的性别注释。
引用
如果您使用此数据集,请引用以下论文:
@misc{https://doi.org/10.48550/arxiv.2207.10246, doi = {10.48550/ARXIV.2207.10246}, url = {https://arxiv.org/abs/2207.10246}, author = {Nadimpalli, Aakash Varma and Rattani, Ajita}, keywords = {Computer Vision and Pattern Recognition (cs.CV), Artificial Intelligence (cs.AI), Machine Learning (cs.LG), FOS: Computer and information sciences, FOS: Computer and information sciences}, title = {GBDF: Gender Balanced DeepFake Dataset Towards Fair DeepFake Detection}, publisher = {arXiv}, year = {2022}, copyright = {arXiv.org perpetual, non-exclusive license} }




