five

madhabpaul/assamese_speech_corpus

收藏
Hugging Face2024-06-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/madhabpaul/assamese_speech_corpus
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - as license: apache-2.0 task_categories: - text-to-speech - text-to-audio - automatic-speech-recognition pretty_name: assamese_speech_corpus dataset_info: - config_name: default features: - name: audio dtype: audio - name: text dtype: string - name: transcription dtype: string splits: - name: train num_bytes: 180656608.503 num_examples: 1877 download_size: 177978848 dataset_size: 180656608.503 - config_name: dual_1 features: - name: audio dtype: audio - name: transcription dtype: string - name: gender dtype: string splits: - name: train num_bytes: 2499710442.564 num_examples: 2812 download_size: 2457362015 dataset_size: 2499710442.564 - config_name: female_1 features: - name: audio dtype: audio - name: transcription dtype: string splits: - name: train num_bytes: 4491574233.545 num_examples: 8705 download_size: 4727313788 dataset_size: 4491574233.545 - config_name: male_1 features: - name: audio dtype: audio - name: transcription dtype: string splits: - name: train num_bytes: 3900445815.842 num_examples: 8941 download_size: 4254963326 dataset_size: 3900445815.842 - config_name: male_2 features: - name: audio dtype: audio - name: transcription dtype: string splits: - name: train num_bytes: 180562898.503 num_examples: 1877 download_size: 177913526 dataset_size: 180562898.503 configs: - config_name: default data_files: - split: train path: data/train-* - config_name: dual_1 data_files: - split: train path: dual_1/train-* - config_name: female_1 data_files: - split: train path: female_1/train-* - config_name: male_1 data_files: - split: train path: male_1/train-* - config_name: male_2 data_files: - split: train path: male_2/train-* ---
提供机构:
madhabpaul
原始信息汇总

数据集概述

基本信息

  • 语言: 阿萨姆语 (as)
  • 许可证: Apache 2.0
  • 任务类别:
    • 文本到语音
    • 文本到音频
    • 自动语音识别
  • 数据集名称: assamese_speech_corpus

配置信息

默认配置 (default)

  • 特征:
    • 音频 (audio)
    • 文本 (text)
    • 转录文本 (transcription)
  • 分割:
    • 训练集 (train)
      • 字节数: 180656608.503
      • 样本数: 1877
  • 下载大小: 177978848
  • 数据集大小: 180656608.503

双语配置 (dual_1)

  • 特征:
    • 音频 (audio)
    • 转录文本 (transcription)
    • 性别 (gender)
  • 分割:
    • 训练集 (train)
      • 字节数: 2499710442.564
      • 样本数: 2812
  • 下载大小: 2457362015
  • 数据集大小: 2499710442.564

女性配置 (female_1)

  • 特征:
    • 音频 (audio)
    • 转录文本 (transcription)
  • 分割:
    • 训练集 (train)
      • 字节数: 4491574233.545
      • 样本数: 8705
  • 下载大小: 4727313788
  • 数据集大小: 4491574233.545

男性配置 (male_1)

  • 特征:
    • 音频 (audio)
    • 转录文本 (transcription)
  • 分割:
    • 训练集 (train)
      • 字节数: 3900445815.842
      • 样本数: 8941
  • 下载大小: 4254963326
  • 数据集大小: 3900445815.842

男性配置 (male_2)

  • 特征:
    • 音频 (audio)
    • 转录文本 (transcription)
  • 分割:
    • 训练集 (train)
      • 字节数: 180562898.503
      • 样本数: 1877
  • 下载大小: 177913526
  • 数据集大小: 180562898.503

数据文件路径

  • 默认配置 (default):
    • 训练集: data/train-*
  • 双语配置 (dual_1):
    • 训练集: dual_1/train-*
  • 女性配置 (female_1):
    • 训练集: female_1/train-*
  • 男性配置 (male_1):
    • 训练集: male_1/train-*
  • 男性配置 (male_2):
    • 训练集: male_2/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作