truong-xuan-linh/vi-xvector-speechbrain

Name: truong-xuan-linh/vi-xvector-speechbrain
Creator: truong-xuan-linh
Published: 2024-01-22 02:35:11
License: 暂无描述

Hugging Face2024-01-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/truong-xuan-linh/vi-xvector-speechbrain

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含406个训练样本，每个样本包括speaker_id、embedding和audio三个特征。其中，audio特征进一步包含bytes和path两个子特征，分别表示音频的二进制数据和路径信息。数据集的总大小为80670618字节，下载大小为78312258字节。

许可证：知识共享署名-非商业性使用4.0（CC BY-NC 4.0）数据集信息：特征项： - 说话人ID（speaker_id）：数据类型为字符串（string） - 嵌入向量（embedding）：为嵌套序列类型，内层序列元素为64位浮点数（float64） - 音频（audio）：为结构体类型，包含两个字段： - 字节流（bytes）：数据类型为二进制（binary） - 路径（path）：数据类型为字符串（string）数据集划分： - 训练集（train）：占用字节数80670618，样本数量406 下载大小：78312258字节数据集总大小：80670618字节配置项： - 默认配置（default）：对应训练划分的数据文件路径格式为data/train-*

提供机构：

truong-xuan-linh

原始信息汇总

数据集概述

许可证

许可证类型：cc-by-nc-4.0

数据集信息

特征信息
- speaker_id：类型为字符串
- embedding：序列类型，包含浮点数（float64）
- audio：结构类型，包含以下字段：
  - bytes：二进制类型
  - path：字符串类型
数据分割
- train：训练集
  - 字节数：80670618
  - 样本数：406

数据集大小

下载大小：78312258
实际大小：80670618

配置信息

默认配置
- 数据文件路径：data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集