five

bandad/sayoko-tts-corpus

收藏
Hugging Face2023-08-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bandad/sayoko-tts-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
サヨ子 音声コーパス是一个包含81岁女性语音的语料库,主要用于文本到语音(Text-to-Speech)任务。数据集包含两个主要目录:wav_noise目录包含原始录音,这些录音在家中录制,包含铃虫等背景噪音和唇部噪音;wav目录则包含尽可能去除噪音后的音频文件,适用于语音合成等任务。此外,数据集还提供了音素和假名标签,分别存储在phoneme和kana目录中。音素标签经过手动修正,但可能仍存在错误,而假名标签则包含音素转换后的假名和韵律符号。数据集的使用条款允许免费和商业用途,但要求在使用时注明出处,并禁止在不当内容中使用。
提供机构:
bandad
原始信息汇总

サヨ子 音声コーパス

概要

  • 年齢: 81歳
  • 性別: 女性
  • 音声コーパス: 高齢女性の音声データ
  • 収録環境: 自宅での収録で、ノイズ(鈴虫など)が含まれている
  • ディレクトリ:
    • wav_noise: 実際に収録された音声(ノイズあり)
    • wav: ノイズ除去済みの音声(音声合成タスク用)
  • ラベル:
    • phoneme: 音素+韻律記号を含むラベル
    • kana: 音素から変換したカナ+韻律記号を含むラベル

韻律記号

ラベル 概要
^ 文の始まり
$ 文の終わり
_ ポーズ
# アクセント境界
[ アクセント上昇
] アクセント核
? 疑問

音素一覧

[ a, i, u, e, o, k, s, t, n, h, m, y, r, w, g, z, d, p, b, ky, gy, sh, j, ch, ny, dy, f, hy, py, by, v, my, ry, cl, ty, N, ts ]

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作