five

omartariq612/everyayah-mapped-to-tajweed-tokens

收藏
Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/omartariq612/everyayah-mapped-to-tajweed-tokens
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频、文本和持续时间等信息,音频采样率为16000Hz。数据集分为训练集和验证集,训练集包含180665个样本,验证集包含49868个样本。每个样本包含音频、sheikh(字符串类型)、持续时间(浮点数类型)和文本(字符串类型)等字段。

The dataset includes four features: audio, speaker, duration, and text. The audio feature has a sampling rate of 16000, while the speaker and text features are of string type, and the duration is of float64 type. The dataset is divided into training and validation sets, containing 180665 and 49868 samples respectively. The total download size of the dataset is 57029585014 bytes, and the total dataset size is 57298417862.916 bytes.
提供机构:
omartariq612
原始信息汇总

数据集概述

特征

  • audio: 音频数据,采样率为16000。
  • sheikh: 字符串类型。
  • duration: 浮点数类型,表示持续时间。
  • text: 字符串类型。

数据分割

  • train: 训练集,包含180665个样本,总大小为46180961288.74字节。
  • validation: 验证集,包含49868个样本,总大小为11117456574.176字节。

数据大小

  • 下载大小: 57029585014字节。
  • 数据集总大小: 57298417862.916字节。

配置

  • default:
    • train: 数据路径为data/train-*
    • validation: 数据路径为data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作