five

LibriQuote

收藏
Hugging Face2025-09-05 更新2025-09-06 收录
下载链接:
https://huggingface.co/datasets/gasmichel/LibriQuote
下载链接
链接失效反馈
官方服务:
资源简介:
LibriQuote数据集是一个包含虚构角色话语的语音数据集,用于表达性的零样本语音合成。该数据集包含了各种虚构角色的发言,旨在帮助开发能够进行情感丰富语音合成的系统。

The LibriQuote dataset is a speech dataset consisting of utterances from fictional characters, tailored for expressive zero-shot speech synthesis. It encompasses speeches from a wide range of fictional characters, with the objective of facilitating the development of systems capable of generating emotionally rich speech synthesis.
创建时间:
2025-09-02
原始信息汇总

LibriQuote 数据集概述

数据集基本信息

  • 许可证:CC BY 4.0
  • 任务类别:文本转语音
  • 语言:英语
  • 标签:语音、表达性语音、语音合成、音频、零样本
  • 规模:10M 到 100M 之间

数据集描述

LibriQuote 是一个用于表达性零样本语音合成的虚构角色语音数据集,包含虚构角色的语音片段。

相关资源

  • 论文:https://arxiv.org/pdf/2509.04072
  • 数据集:https://huggingface.co/datasets/gasmichel/LibriQuote/tree/main
  • 论文音频样本:https://libriquote.github.io/
  • GitHub 仓库:https://github.com/gasmichel/test/tree/main

引用信息

bibtex @misc{Michel2025LibriQuote, title={LibriQuote: A Speech Dataset of Fictional Character Utterances for Expressive Zero-Shot Speech Synthesis}, author={Gaspard Michel and Elena V. Epure and Christophe Cerisara}, year={2025}, eprint={2509.04072}, archivePrefix={arXiv}, primaryClass={eess.AS}, url={https://arxiv.org/abs/2509.04072} }

搜集汇总
数据集介绍
main_image_url
构建方式
在语音合成研究领域,高质量数据集的构建对推动零样本表达能力至关重要。LibriQuote数据集通过精选虚构角色对话片段,从公开的有声读物资源中系统提取语音样本,并依据角色身份和情感表达进行精细标注,确保每条语音数据均具备明确的说话人属性和情感上下文。
特点
该数据集的核心特点在于其专注于表达性零样本语音合成任务,涵盖丰富的情感层次和角色多样性。所有语音样本均关联至特定虚构角色,支持跨角色语音风格迁移研究,同时提供高质量的音频与文本对齐信息,为模型训练提供多模态监督信号。
使用方法
研究者可利用该数据集训练零样本语音合成模型,通过输入目标角色的文本描述及参考音频,生成符合角色特征的表达性语音。数据集已划分为标准训练、验证和测试集,支持端到端模型训练与跨角色泛化能力评估,具体预处理流程详见其GitHub代码库。
背景与挑战
背景概述
语音合成领域近年来在表达性零样本生成方面面临重要突破需求,LibriQuote数据集应运而生。该数据集由Gaspard Michel等研究人员于2025年创建,专注于虚构角色话语的采集与标注。其核心研究在于解决传统语音合成系统在零样本场景下缺乏表现力和角色适配性的问题,通过构建大规模角色语音语料库,为表达性语音合成提供重要数据支撑。该数据集的发布显著推进了个性化语音合成技术的发展,为多媒体内容创作和虚拟人交互系统提供了关键基础设施。
当前挑战
表达性零样本语音合成面临双重挑战:在领域问题层面,模型需突破未见角色声音的泛化能力瓶颈,实现音色、情感和语调的多维度适配;同时要解决跨角色语音风格迁移中的语义一致性与自然度平衡问题。在构建过程中,数据集需要精确标注虚构角色的身份属性与情感特征,确保语音片段与角色特征的严格对应;此外还需处理大规模音频数据的质量统一性,消除录制环境和发音人差异带来的噪声干扰,保证数据集的学术价值与应用可靠性。
常用场景
经典使用场景
在语音合成研究领域,LibriQuote数据集被广泛用于零样本语音合成任务,特别是在生成具有特定角色情感和风格的语音表达方面。该数据集通过提供虚构角色的话语样本,使研究人员能够训练模型在未见过的角色上实现高度表现力的语音合成,从而推动个性化语音生成技术的发展。
实际应用
在实际应用中,LibriQuote数据集为虚拟助手、有声读物和游戏角色配音提供了技术基础。通过利用该数据集训练的模型,开发者能够为不同虚构角色生成逼真且情感丰富的语音,增强用户体验,并在娱乐、教育和客户服务等领域实现更自然的语音交互。
衍生相关工作
基于LibriQuote数据集,研究者已开发出多种先进的零样本语音合成模型,这些工作扩展了表达性语音合成的边界。相关研究包括跨角色语音风格迁移、情感语音生成以及多语言语音合成,这些衍生工作进一步丰富了语音技术的研究生态,并推动了实际应用的创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作