kotoba-speech/test_2

Name: kotoba-speech/test_2
Creator: kotoba-speech
Published: 2024-06-17 16:18:01
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/kotoba-speech/test_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频标记、说话者嵌入、文本标记等多种特征，并且包含数据集ID、键、持续时间、语言、比率等信息。数据集被分为一个测试集，包含500个例子，总大小为4329534字节。下载大小为3265556字节。

This dataset includes various features such as audio tokens, speaker embeddings, text tokens, and also contains dataset ID, key, duration, language, ratio, etc. The dataset is divided into a test set containing 500 examples, with a total size of 4329534 bytes. The download size is 3265556 bytes.

提供机构：

kotoba-speech

原始信息汇总

数据集概述

数据集信息

配置名称: subset_e
特征:
- audio_tokens: 序列类型，int16
- spk_embed: 序列类型，float32
- text_tokens: 序列类型，int16
- dataset_id: 字符串类型
- key: 字符串类型
- duration: 浮点数类型，float64
- lang: 字符串类型
- ratio: 浮点数类型，float64
- text_en_gpt3.5_tokens: 序列类型，int16
- audio_tokens_bpe: 序列类型，int16
- text_tokens_llama: 序列类型，int16
- text_en_gpt3.5_tokens_llama: 序列类型，int16

数据集分割

test:
- 文件大小: 4329534 字节
- 样本数量: 500

数据集大小

下载大小: 3265556 字节
数据集大小: 4329534 字节

配置

配置名称: subset_e
数据文件:
- 分割: test
- 路径: subset_e/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集