gemini-2.5-pro-tts-voice-profiles
收藏Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/laion/gemini-2.5-pro-tts-voice-profiles
下载链接
链接失效反馈官方服务:
资源简介:
Gemini 2.5 Pro TTS Voice Profiles 是一个高质量语音数据集,包含28,946个语音样本,由21种不同的语音身份生成。每个样本都标注了59种情感/质量分数(Empathic Insight Voice Plus)、BUD-E Whisper音频描述和单词级时间戳。数据集支持四种语言(德语、英语、西班牙语、法语)和多种口音,音频格式为未压缩的PCM,采样率为24,000 Hz,位深度为16位。数据集还包括预构建的FAISS相似性索引,用于基于情感特征和音频特性的语义搜索。适用于文本到语音、音频分类等任务,特别适合需要情感丰富、多样化的语音样本的研究和应用。
提供机构:
LAION eV
创建时间:
2026-03-22



