five

gemini-2.5-pro-tts-voice-profiles

收藏
Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/laion/gemini-2.5-pro-tts-voice-profiles
下载链接
链接失效反馈
官方服务:
资源简介:
Gemini 2.5 Pro TTS Voice Profiles 是一个高质量语音数据集,包含28,946个语音样本,由21种不同的语音身份生成。每个样本都标注了59种情感/质量分数(Empathic Insight Voice Plus)、BUD-E Whisper音频描述和单词级时间戳。数据集支持四种语言(德语、英语、西班牙语、法语)和多种口音,音频格式为未压缩的PCM,采样率为24,000 Hz,位深度为16位。数据集还包括预构建的FAISS相似性索引,用于基于情感特征和音频特性的语义搜索。适用于文本到语音、音频分类等任务,特别适合需要情感丰富、多样化的语音样本的研究和应用。
提供机构:
LAION eV
创建时间:
2026-03-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作