five

aztro/mabama-v7

收藏
Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/aztro/mabama-v7
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频文件及其对应的文本信息和说话者ID。数据集分为训练集、测试集和验证集,分别包含264、69和69个样本。音频文件格式为.wav,文本信息为字符串类型。数据集主要用于文本到语音的任务,语言为西班牙语。

This dataset contains audio files along with corresponding text information and speaker IDs. The dataset is divided into training, test, and validation sets, containing 264, 69, and 69 samples respectively. The audio files are in .wav format, and the text information is in string format. The dataset is primarily used for text-to-speech tasks and is in Spanish.
提供机构:
aztro
原始信息汇总

数据集概述

数据集信息

特征

  • file_name: 音频文件名,数据类型为 audio
  • text: 文本内容,数据类型为 string
  • speaker_id: 说话者ID,数据类型为 string

数据分割

  • train: 训练集,包含264个样本,总大小为95126174字节。
  • test: 测试集,包含69个样本,总大小为24879460字节。
  • validation: 验证集,包含69个样本,总大小为24594156字节。

配置

  • config_name: default
    • 数据文件路径:
      • /train/*.wav
      • /test/*.wav
      • /&validation/*.wav

许可证

  • license: MIT

任务类别

  • text-to-speech: 文本到语音转换任务。

语言

  • es: 西班牙语。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作