asahi417/seamless-align-enA-hiA.speaker-embedding.xlsr-2b
收藏Hugging Face2024-06-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-hiA.speaker-embedding.xlsr-2b
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个子集(subset_1到subset_37),每个子集具有相同的特征结构。每个子集包含行号、英语和印地语音频的ID、两种语言的激光评分以及英语和印地语音频的说话者嵌入。数据集被划分为训练集,每个子集都有指定的字节数和示例数。该数据集主要关注音频数据及其相关元数据,可能用于说话者识别或音频分析等任务。
The dataset contains multiple subsets (subset_1 to subset_37), each with the same feature structure. Each subset includes line numbers, IDs for English and Hindi audio, laser scores for both languages, and speaker embeddings for both English and Hindi audio. The dataset is divided into training sets, with each subset having a specified number of bytes and examples. The dataset primarily focuses on audio data and associated metadata, likely used for tasks such as speaker recognition or audio analysis.
提供机构:
asahi417
原始信息汇总
数据集概述
数据集配置
子集 1 (subset_1)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 17,180,789,550
- 样本数: 2,295
- 下载大小: 17,236,574,573 字节
- 数据集大小: 17,180,789,550 字节
子集 10 (subset_10)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,742,804,073
- 样本数: 2,026
- 下载大小: 12,788,003,730 字节
- 数据集大小: 12,742,804,073 字节
子集 11 (subset_11)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,272,854,859
- 样本数: 1,984
- 下载大小: 12,316,592,061 字节
- 数据集大小: 12,272,854,859 字节
子集 12 (subset_12)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,398,290,108
- 样本数: 2,004
- 下载大小: 12,441,408,885 字节
- 数据集大小: 12,398,290,108 字节
子集 13 (subset_13)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 11,717,266,547
- 样本数: 1,931
- 下载大小: 11,757,900,835 字节
- 数据集大小: 11,717,266,547 字节
子集 14 (subset_14)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,269,481,241
- 样本数: 1,980
- 下载大小: 12,313,184,930 字节
- 数据集大小: 12,269,481,241 字节
子集 15 (subset_15)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 11,479,241,584
- 样本数: 1,959
- 下载大小: 11,520,674,730 字节
- 数据集大小: 11,479,241,584 字节
子集 16 (subset_16)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 11,923,472,390
- 样本数: 2,001
- 下载大小: 11,966,386,607 字节
- 数据集大小: 11,923,472,390 字节
子集 17 (subset_17)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,570,712,854
- 样本数: 2,022
- 下载大小: 12,616,016,106 字节
- 数据集大小: 12,570,712,854 字节
子集 18 (subset_18)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 11,903,638,932
- 样本数: 1,988
- 下载大小: 11,946,364,043 字节
- 数据集大小: 11,903,638,932 字节
子集 19 (subset_19)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 11,957,724,721
- 样本数: 1,965
- 下载大小: 11,998,408,667 字节
- 数据集大小: 11,957,724,721 字节
子集 2 (subset_2)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 17,146,929,552
- 样本数: 2,335
- 下载大小: 17,202,836,567 字节
- 数据集大小: 17,146,929,552 字节
子集 20 (subset_20)
- 特征:
line_no: 整数类型 (int64)enA.id: 字符串类型 (string)enA.laser_score: 浮点数类型 (float64)hiA.id: 字符串类型 (string)hiA.laser_score: 浮点数类型 (float64)enA.audio.speaker_embedding: 浮点数序列 (float32)enA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)hiA.audio.speaker_embedding: 浮点数序列 (float32)hiA.audio.speaker_embedding.full: 嵌套浮点数序列 (float32)
- 分割:
train:- 字节数: 12,105,711,369
- 样本数: 1,971
- 下载大小: 12,149,353,622 字节
- 数据集大小: 12,105,711,369 字节
子集 21 (subset_21)
- 特征:
line_no: 整数类型 (int64)- `



