VCTK Corpus
收藏数据集概述
数据集名称
- Full-context label for VCTK-Corpus
数据集内容
- 提供VCTK-Corpus的完整上下文标签文件。
数据集结构
├── lab │ ├── full │ │ ├── p225 │ │ │ ├── p225_001.lab │ │ │ ├── p225_002.lab │ │ │ ├── p225_003.lab │ │ │ ├── p225_004.lab │ │ │ ├── p225_005.lab │ │ │ ... │ ├── mono │ │ ├── p225 │ │ │ ├── p225_001.lab │ │ │ ├── p225_002.lab │ │ │ ├── p225_003.lab │ │ │ ├── p225_004.lab │ │ │ ├── p225_005.lab │ │ │ ...
缺失文件
lab/*/p315/*.lab(p315 lacks txt)lab/mono/p295/p295_047.lab(alignment failed)lab/mono/p305/p305_423.lab(alignment failed)lab/mono/p317/p317_424.lab(alignment failed)lab/mono/p345/p345_387.lab(alignment failed)
标签格式
Mono label
0 850000 pau
850000 2850000 pau
2850000 3600000 p 3600000 3900000 l 3900000 6000000 iy 6000000 8450000 z 8450000 8600000 k 8600000 11300000 ao 11300000 11450000 l 11450000 12800000 s 12800000 13099999 t 13099999 15800000 eh 15800000 16050000 l 16050000 17600000 ax 17600000 20400000 pau
Full context label
0 850000 x^x-pau+pau=p@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/C:0+0+0/D:0_0/E:x+x@x+x&x+x#x+x/F:0_0/G:0_0/H:x=x@1=1|0/I:0=0/J:4+3-1
850000 2850000 x^pau-pau+p=l@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-x!x-x;x-x|x/C:1+1+4/D:0_0/E:x+x@x+x&x+x#x+x/F:content_1/G:0_0/H:x=x@1=1|0/I:4=3/J:4+3-1
2850000 3600000 pau^pau-p+l=iy@1_4/A:0_0_0/B:1-1-4@1-1&1-4#1-3$1-4!0-1;0-1|iy/C:1+1+3/D:0_0/E:content+1@1+3&1+2#0+1/F:content_1/G:0_0/H:4=3@1=1|L-L%/I:0=0/J:4+3-1 ...
参考资料

- VCTK Corpus首次发表,由英国剑桥大学发布,旨在为语音合成研究提供高质量的多人语音数据。
- VCTK Corpus首次应用于语音合成领域的研究,特别是在多说话人语音合成模型的训练中。
- VCTK Corpus被广泛应用于语音识别和语音合成领域的多个研究项目,成为该领域的重要基准数据集。
- VCTK Corpus的数据质量和多样性得到进一步认可,被用于多个国际语音处理会议的实验和竞赛中。
- VCTK Corpus的版本更新,增加了更多的语音样本和说话人,以满足日益增长的语音技术研究需求。



