anzorq/sixuxar_yijiri_mak7
收藏Hugging Face2023-10-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anzorq/sixuxar_yijiri_mak7
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- kbd
task_categories:
- automatic-speech-recognition
- text-to-speech
dataset_info:
features:
- name: audio
dtype: audio
- name: text
dtype: string
splits:
- name: train
num_bytes: 337947909.07
num_examples: 6579
download_size: 727728499
dataset_size: 337947909.07
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
license: mit
---
# Dataset Info
This dataset consists of paired audio and text data sourced from the following book:
- **Title**: Къэрмокъуэ М. Щихухэр иджыри мэкI. Япэ тхылъ.
- **Publication**: Нальчик: Эльбрус, 1999
## Audio Specifications
- **Sample Rate**: 16,000 Hz
- **Total Length**: 10:36:40
- **Source**: [adigabook.ru](http://www.adigabook.ru/?p=1148)
## Processing Information
Audio-text pairs for this dataset were extracted and aligned using META AI's [forced alignment algorithm](https://github.com/facebookresearch/fairseq/tree/main/examples/mms/data_prep).
提供机构:
anzorq
原始信息汇总
数据集信息
数据集概述
该数据集包含配对的音频和文本数据,来源于以下书籍:
- 书名: Къэрмокъуэ М. Щихухэр иджыри мэкI. Япэ тхылъ.
- 出版信息: Нальчик: Эльбрус, 1999
数据集特征
- 音频:
- 采样率: 16,000 Hz
- 总时长: 10:36:40
- 来源: adigabook.ru
- 文本:
- 数据类型: string
数据集结构
- 特征:
audio: 音频数据text: 文本数据
- 分割:
train: 训练集- 字节数: 337947909.07
- 样本数: 6579
数据集大小
- 下载大小: 727728499
- 数据集大小: 337947909.07
配置
- 默认配置:
- 数据文件:
train: data/train-*
- 数据文件:
许可
- 许可证: MIT
处理信息
音频-文本对是通过META AI的forced alignment algorithm提取和校准的。



