five

kotoba-speech/test_2

收藏
Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/kotoba-speech/test_2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频标记、说话者嵌入、文本标记等多种特征,并且包含数据集ID、键、持续时间、语言、比率等信息。数据集被分为一个测试集,包含500个例子,总大小为4329534字节。下载大小为3265556字节。

This dataset includes various features such as audio tokens, speaker embeddings, text tokens, and also contains dataset ID, key, duration, language, ratio, etc. The dataset is divided into a test set containing 500 examples, with a total size of 4329534 bytes. The download size is 3265556 bytes.
提供机构:
kotoba-speech
原始信息汇总

数据集概述

数据集信息

  • 配置名称: subset_e
  • 特征:
    • audio_tokens: 序列类型,int16
    • spk_embed: 序列类型,float32
    • text_tokens: 序列类型,int16
    • dataset_id: 字符串类型
    • key: 字符串类型
    • duration: 浮点数类型,float64
    • lang: 字符串类型
    • ratio: 浮点数类型,float64
    • text_en_gpt3.5_tokens: 序列类型,int16
    • audio_tokens_bpe: 序列类型,int16
    • text_tokens_llama: 序列类型,int16
    • text_en_gpt3.5_tokens_llama: 序列类型,int16

数据集分割

  • test:
    • 文件大小: 4329534 字节
    • 样本数量: 500

数据集大小

  • 下载大小: 3265556 字节
  • 数据集大小: 4329534 字节

配置

  • 配置名称: subset_e
  • 数据文件:
    • 分割: test
    • 路径: subset_e/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作