five

formospeech/hac_vocab

收藏
Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/formospeech/hac_vocab
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置包含音频数据及其相关的文本、国际音标(IPA)和方言信息。数据集的特征包括id、音频、持续时间、文本、国际音标(IPA)和方言。每个配置仅包含训练集,并提供了训练集的字节数和示例数。

该数据集包含多个配置,每个配置包含音频数据及其相关的文本、国际音标(IPA)和方言信息。数据集的特征包括id、音频、持续时间、文本、国际音标(IPA)和方言。每个配置仅包含训练集,并提供了训练集的字节数和示例数。
提供机构:
formospeech
原始信息汇总

数据集概述

数据集配置

dapu_e

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 833854232.446
      • num_examples: 12627
  • 下载大小: 913243480
  • 数据集大小: 833854232.446

dapu_v

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 148176903.421
      • num_examples: 2127
  • 下载大小: 139079431
  • 数据集大小: 148176903.421

hailu_e

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 777538559.522
      • num_examples: 11333
  • 下载大小: 859150701
  • 数据集大小: 777538559.522

hailu_v

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 107400973.8
      • num_examples: 2200
  • 下载大小: 107627159
  • 数据集大小: 107400973.8

raoping_e

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 458278856.518
      • num_examples: 6531
  • 下载大小: 506610288
  • 数据集大小: 458278856.518

raoping_v

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 3281586.0
      • num_examples: 70
  • 下载大小: 3119696
  • 数据集大小: 3281586.0

sixian_e

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 392766673.66
      • num_examples: 5174
  • 下载大小: 407355625
  • 数据集大小: 392766673.66

sixian_v

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 166804462.942
      • num_examples: 3507
  • 下载大小: 179987711
  • 数据集大小: 166804462.942

zhaoan_e

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 865925964.056
      • num_examples: 13028
  • 下载大小: 902380660
  • 数据集大小: 865925964.056

zhaoan_v

  • 特征:
    • id: string
    • audio: audio
    • duration: float64
    • text: string
    • ipa: string
    • dialect: string
  • 分割:
    • train:
      • num_bytes: 122693154.682
      • num_examples: 2221
  • 下载大小: 121070219
  • 数据集大小: 122693154.682
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作