language-and-voice-lab/samromur_synthetic
收藏Hugging Face2024-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/language-and-voice-lab/samromur_synthetic
下载链接
链接失效反馈官方服务:
资源简介:
Samrómur Synthetic是一个由冰岛语合成语音组成的语料库,使用了Reykjavík大学的语言和语音实验室开发的文本到语音(TTS)系统生成。该数据集主要用于自动语音识别(ASR)任务,包含62,700个语音片段,总时长为72小时52分钟26秒。语音片段来自44种不同的声音(22男性和22女性),每个声音在5种不同的速度下生成语音。数据集仅包含训练集,且所有语音片段都是合成的,不包含个人或敏感信息。
Samrómur Synthetic是一个由冰岛语合成语音组成的语料库,使用了Reykjavík大学的语言和语音实验室开发的文本到语音(TTS)系统生成。该数据集主要用于自动语音识别(ASR)任务,包含62,700个语音片段,总时长为72小时52分钟26秒。语音片段来自44种不同的声音(22男性和22女性),每个声音在5种不同的速度下生成语音。数据集仅包含训练集,且所有语音片段都是合成的,不包含个人或敏感信息。
提供机构:
language-and-voice-lab
原始信息汇总
数据集概述
数据集名称
- 名称: Samrómur Synthetic
- 别名: 无
数据集基本信息
- 语言: 冰岛语
- 语言生成方式: 机器生成
- 许可证: CC-BY-4.0
- 多语言性: 单语种
- 数据集大小: 10K<n<100K
- 数据来源: 原始数据
- 标签: 冰岛语, 合成语音, 合成演讲, TTS
- 任务类别: 自动语音识别
数据集描述
- 摘要: Samrómur Synthetic 是一个由冰岛语合成语音构成的语料库。该语料库使用由雷克雅未克大学语言与语音实验室开发的文本到语音(TTS)系统生成。
- 支持任务: 自动语音识别(ASR)
- 数据实例结构: 包含音频ID、音频文件路径、采样率、说话人ID、合成声音ID、性别、语速率、持续时间和标准化文本。
- 数据字段: 包括音频ID、音频信息、说话人ID、声音ID、性别、语速率、持续时间和标准化文本。
- 数据分割: 仅包含训练集,训练集包含62700个语音片段,总时长72小时52分钟26秒。
数据集创建
- 数据收集与规范化: 从Samrómur平台提取句子,使用TTS系统生成语音。
- 注释过程: 由作者选择句子进行合成。
- 个人与敏感信息: 数据集包含合成语音,无个人或敏感信息。
使用数据集的考虑
- 社会影响: 目前唯一公开可用的冰岛语合成语音语料库。
- 偏见讨论: 包含44种不同声音,22种男性声音和22种女性声音,以及5种不同的语速率。
- 其他已知限制: 数据集按说话人分类,每个说话人有285个语音片段,平均每个语音片段12.785个单词。
附加信息
- 数据集管理: 由Carlos Daniel Hernández Mena在2023年6月期间在语言与语音实验室进行管理。
- 许可证信息: CC-BY-4.0
- 引用信息: 见README文件中的引用格式。
- 贡献: 项目由冰岛语言技术计划2019-2023资助。



