formospeech/hac_vocab
收藏Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/formospeech/hac_vocab
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置包含音频数据及其相关的文本、国际音标(IPA)和方言信息。数据集的特征包括id、音频、持续时间、文本、国际音标(IPA)和方言。每个配置仅包含训练集,并提供了训练集的字节数和示例数。
该数据集包含多个配置,每个配置包含音频数据及其相关的文本、国际音标(IPA)和方言信息。数据集的特征包括id、音频、持续时间、文本、国际音标(IPA)和方言。每个配置仅包含训练集,并提供了训练集的字节数和示例数。
提供机构:
formospeech
原始信息汇总
数据集概述
数据集配置
dapu_e
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 833854232.446
- num_examples: 12627
- train:
- 下载大小: 913243480
- 数据集大小: 833854232.446
dapu_v
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 148176903.421
- num_examples: 2127
- train:
- 下载大小: 139079431
- 数据集大小: 148176903.421
hailu_e
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 777538559.522
- num_examples: 11333
- train:
- 下载大小: 859150701
- 数据集大小: 777538559.522
hailu_v
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 107400973.8
- num_examples: 2200
- train:
- 下载大小: 107627159
- 数据集大小: 107400973.8
raoping_e
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 458278856.518
- num_examples: 6531
- train:
- 下载大小: 506610288
- 数据集大小: 458278856.518
raoping_v
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 3281586.0
- num_examples: 70
- train:
- 下载大小: 3119696
- 数据集大小: 3281586.0
sixian_e
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 392766673.66
- num_examples: 5174
- train:
- 下载大小: 407355625
- 数据集大小: 392766673.66
sixian_v
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 166804462.942
- num_examples: 3507
- train:
- 下载大小: 179987711
- 数据集大小: 166804462.942
zhaoan_e
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 865925964.056
- num_examples: 13028
- train:
- 下载大小: 902380660
- 数据集大小: 865925964.056
zhaoan_v
- 特征:
- id: string
- audio: audio
- duration: float64
- text: string
- ipa: string
- dialect: string
- 分割:
- train:
- num_bytes: 122693154.682
- num_examples: 2221
- train:
- 下载大小: 121070219
- 数据集大小: 122693154.682
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



