voidful/cv_13_tw_speech_tokenizer

Name: voidful/cv_13_tw_speech_tokenizer
Creator: voidful
Published: 2024-06-05 23:52:45
License: 暂无描述

Hugging Face2024-06-05 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/voidful/cv_13_tw_speech_tokenizer

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: input dtype: string - name: label dtype: string splits: - name: train num_bytes: 251756926.80339798 num_examples: 48923 - name: test num_bytes: 62940518.196602024 num_examples: 12231 download_size: 92029688 dataset_size: 314697445.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

提供机构：

voidful

原始信息汇总

数据集概述

数据集特征

input：数据类型为字符串。
label：数据类型为字符串。

数据集分割

训练集：包含48923个样本，总大小为251756926.80339798字节。
测试集：包含12231个样本，总大小为62940518.196602024字节。

数据集大小

下载大小：92029688字节。
数据集总大小：314697445.0字节。

数据文件配置

默认配置：
- 训练集路径：data/train-*
- 测试集路径：data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集