five

Speech-Forensics|语音分析数据集|语音取证数据集

收藏
arXiv2024-12-16 更新2024-12-14 收录
语音分析
语音取证
下载链接:
https://github.com/ring-zl/Speech-Forensics
下载链接
链接失效反馈
资源简介:
Speech-Forensics数据集由西安交通大学创建,旨在提供一个全面的合成语音分析数据集,涵盖真实语音、合成语音和部分伪造语音样本。数据集包含4323条记录,通过NER和反义词替换策略生成,确保语义一致性。数据集支持多维度的语音分析任务,包括真实性检测、伪造区域定位和合成算法识别,旨在解决语音伪造检测和身份冒充等问题。
提供机构:
西安交通大学
创建时间:
2024-12-12
AI搜集汇总
数据集介绍
main_image_url
构建方式
Speech-Forensics数据集的构建过程严格遵循了多步骤的数据处理流程,以确保生成的语音样本在语义上保持一致性和真实性。首先,从LJ Speech数据集中选择合适的音频内容,并通过命名实体识别(NER)算法对文本进行编辑,替换其中的实体以增加多样性。接着,使用反义词替换策略对形容词进行修改,以模拟实际语音伪造中的多样化场景。随后,通过先进的文本到语音(TTS)和语音转换(VC)算法生成合成音频,并使用Montreal Forced Aligner工具进行音频与文本的对齐,确保合成片段能够无缝融入原始音频。最终,数据集包含了多种合成算法生成的多段伪造语音,并详细记录了每个伪造片段的算法信息,为后续的语音分析提供了丰富的数据支持。
特点
Speech-Forensics数据集的显著特点在于其全面性和多样性。该数据集不仅包含了真实的语音样本,还涵盖了多种合成算法生成的伪造语音,支持从语音真实性检测到伪造片段定位以及合成算法识别的多维度分析。此外,数据集中的每个样本都包含了多个伪造片段,且每个片段都标注了具体的合成算法,使得研究者能够进行更为细致的分析。数据集的构建方式确保了伪造语音在语义上的连贯性,使其更贴近实际应用场景,从而为语音伪造检测和分析提供了强有力的支持。
使用方法
Speech-Forensics数据集可广泛应用于语音伪造检测、伪造片段定位以及合成算法识别等多个任务。研究者可以利用该数据集训练模型,以实现对语音真实性的自动检测,同时定位伪造片段并识别其使用的合成算法。数据集提供了详细的标注信息,包括每个伪造片段的时间戳和对应的合成算法,使得模型能够在无需复杂后处理的情况下,直接输出伪造片段的位置和算法类型。此外,数据集的多维度特性使其适用于多种语音分析任务,为研究者提供了丰富的实验数据,有助于推动语音伪造检测技术的发展。
背景与挑战
背景概述
随着深度伪造技术的快速发展,语音伪造的检测变得愈发重要,尤其是在防范虚假信息和身份冒充方面。尽管已有多个合成语音分析数据集,但它们往往局限于特定领域,难以满足全面研究的需求。为此,西安交通大学的研究团队于2024年提出了Speech-Forensics数据集,旨在通过涵盖真实的、合成的以及部分伪造的语音样本,支持多维度的语音分析。该数据集不仅记录了伪造算法,还通过多区域伪造的方式,增强了数据集的复杂性和实用性,为语音伪造检测、区域定位和算法识别提供了全面的基准。
当前挑战
Speech-Forensics数据集的构建面临多重挑战。首先,如何在保持语音语义连贯性的同时,生成多样化的伪造样本是一个技术难题。其次,现有的数据集大多侧重于单一的伪造检测任务,而Speech-Forensics需要同时支持伪造检测、区域定位和算法识别,这对模型的复杂性和精度提出了更高的要求。此外,数据集的多样性和规模也限制了其在实际应用中的广泛适用性,尤其是在面对未知伪造算法时,模型的泛化能力仍需进一步提升。
常用场景
经典使用场景
Speech-Forensics数据集的经典使用场景主要集中在合成语音的全面分析上。该数据集包含了多种类型的合成语音样本,包括完全合成、部分合成以及多种合成算法生成的语音片段。研究人员可以利用该数据集进行合成语音的真实性检测、伪造片段的定位以及合成算法的识别。通过这些任务,研究人员能够开发出更为精确和全面的语音伪造检测模型,以应对日益复杂的语音伪造技术。
解决学术问题
Speech-Forensics数据集解决了合成语音分析领域中的多个关键学术问题。首先,它填补了现有数据集在多区域伪造和多算法识别方面的不足,使得研究人员能够进行更为细致的语音伪造分析。其次,该数据集支持对合成语音的全面分析,包括真实性检测、伪造片段定位和算法识别,从而推动了语音伪造检测技术的发展。此外,通过提供详细的伪造算法标签,该数据集为研究者提供了深入理解合成语音生成过程的机会,进一步提升了语音伪造检测的准确性和鲁棒性。
衍生相关工作
Speech-Forensics数据集的发布催生了一系列相关研究工作。首先,基于该数据集,研究人员开发了多种语音伪造检测模型,如TEST网络,该模型能够同时进行真实性检测、伪造片段定位和算法识别。其次,该数据集促进了多任务学习在语音伪造检测中的应用,推动了合成语音分析技术的进步。此外,Speech-Forensics数据集还为语音伪造检测领域的基准测试提供了新的标准,促进了该领域的技术交流和合作。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

UAV123

从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。

OpenDataLab 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

熟肉制品在全国需求价格弹性分析数据

为更好了解各市对熟肉制品的市场需求情况,本行业所有企业对相关熟肉制品需求弹性数据进行采集计算。如果熟肉制品需求量变动的比率大于价格变动的比率,那么熟肉制品需求富有弹性,说明顾客对于熟肉制品价格变化的敏感程度大,弹性越大,需求对价格变化越敏感,本行业所有企业可以在该市适当的降低熟肉制品价格来获得较多的收益。如果熟肉制品需求缺乏弹性,本行业所有企业可以在该市适当的提高熟肉制品价格来获得较多的收益。该项数据对本行业所有企业在全国的市场营销决策有重要意义。1.数据采集:采集相关熟肉制品在某一时间段全国的的需求数据和价格数据,按照市级进行整理归纳,得到该熟肉制品的需求量变动数值和价格变化数值。 2.算法规则:对采集得到的数据按照如下公式进行计算:需求弹性系数Ed=-(△Q/Q)÷(△P/P),得到需求弹性系数。式中:Q表示产品的需求量,单位为份;P表示产品的价格,单位为元;△Q表示需求量同比变动值,单位为份;△P表示价格同比变动值,单位为元。取需求弹性系数的绝对值|Ed|作为分析数据时的参考系数。 3.数据分析:根据|Ed|的数值可分析该熟肉制品的需求价格弹性。(1)|Ed|=1(单位需求价格弹性),说明需求量变动幅度与价格变动幅度相同;(2)1<|Ed|(需求富有弹性),说明需求量变动幅度大于价格变动幅度;(3)|Ed|<1(需求缺乏弹性),说明需求量变动幅度小于价格变动幅度。

浙江省数据知识产权登记平台 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录