PolyGlotFake|深度伪造检测数据集|多模态数据数据集
收藏数据集概述
PolyGlotFake 是一个多语言和多模态的深度伪造检测数据集,包含视频中的音频和视觉组件被操纵的内容,涵盖七种语言,并使用了先进的文本到语音、声音克隆和唇同步技术。
数据集详情
组成
- 总视频数: 15,238
- 真实视频数: 766
- 伪造视频数: 14,472
- 分辨率: 1280x720
- 平均视频时长: 11.79秒
语言和技术分布
- 语言: 英语、法语、西班牙语、俄语、中文、阿拉伯语、日语
- 技术:
- 音频操纵: Bark+FreeVC, MicroTTS+FreeVC, XTTS, Tacotron+FreeVC, Vall-E-X
- 视频操纵: VideoRetalking, Wav2Lip
生成流程
深度伪造检测基准
评估结果与比较
类型 | 检测器 | 主干网络 | FakeAVCeleb | DFDC | PolyGlotFake |
---|---|---|---|---|---|
Naive | MesoNet | 设计 | 0.7332 | 0.5906 | 0.5672 |
Naive | MesoInception | 设计 | 0.7945 | 0.6344 | 0.5831 |
Naive | Xception | Xception | 0.9169 | 0.6530 | 0.6052 |
Naive | EfficienNet-B4 | EfficienNet | 0.9023 | 0.6020 | 0.5769 |
Spatial | Capsule | Capsule | 0.8663 | 0.6146 | 0.6068 |
Spatial | FFD | Xception | 0.9285 | 0.6583 | 0.5960 |
Spatial | CORE | Xception | 0.9345 | 0.6625 | 0.6220 |
Spatial | RECCE | 设计 | 0.9396 | 0.6884 | 0.6596 |
Spatial | DSP-FWA | Xception | 0.9115 | 0.6929 | 0.6658 |
Frequency | F3Net | Xception | 0.9416 | 0.6452 | 0.6439 |
Frequency | SRM | Xception | 0.9043 | 0.6346 | 0.6143 |
Ensemble | XRes | 设计 | 0.9556 | 0.7042 | 0.6835 |
数据集可视化

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
COVID-19 Data Hub
COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。
covid19datahub.io 收录