azain/LibriTTS-dev-clean-16khz-mono-loudnorm-100-random-samples-2024-04-18-17-34-39-converted

Name: azain/LibriTTS-dev-clean-16khz-mono-loudnorm-100-random-samples-2024-04-18-17-34-39-converted
Creator: azain
Published: 2024-04-19 18:13:38
License: 暂无描述

Hugging Face2024-04-19 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/azain/LibriTTS-dev-clean-16khz-mono-loudnorm-100-random-samples-2024-04-18-17-34-39-converted

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: audio dtype: audio - name: transcript dtype: string - name: speaker_id dtype: string - name: asr_transcription struct: - name: text dtype: string - name: embeddings sequence: float32 splits: - name: train num_bytes: 17941169.0 num_examples: 100 download_size: 17901496 dataset_size: 17941169.0 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征项： - 名称：音频（audio），数据类型：音频 - 名称：转录文本（transcript），数据类型：字符串 - 名称：说话人ID（speaker_id），数据类型：字符串 - 名称：自动语音识别转录结果（asr_transcription），为结构体，包含子字段： - 名称：文本（text），数据类型：字符串 - 名称：嵌入向量（embeddings），数据类型：float32序列数据集划分： - 划分名称：训练集（train），字节数：17941169.0，样本数量：100 下载总大小：17901496 数据集存储总大小：17941169.0 配置项： - 配置名称：默认配置（default），数据文件： - 划分集：训练集（train），文件路径：data/train-*

提供机构：

azain

原始信息汇总

数据集概述

数据集特征

audio: 音频数据
transcript: 文本数据
speaker_id: 说话者标识
asr_transcription: 自动语音识别转录
- text: 文本数据
embeddings: 嵌入向量序列，数据类型为float32

数据集划分

train: 训练集
- num_bytes: 17941169.0字节
- num_examples: 100个样本

数据集大小

download_size: 17901496字节
dataset_size: 17941169.0字节

配置

config_name: default
- data_files:
  - split: train
    - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集