asahi417/seamless-align-enA-koA
收藏Hugging Face2024-06-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-koA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个子集,每个子集包含英语和韩语的音频数据及其相关元数据,如音频ID、URL、起始和结束时间以及Laser评分。每个子集都有一个训练集,包含一定数量的样本和字节大小。
This dataset contains multiple subsets, each containing audio data in English and Korean along with related metadata such as audio IDs, URLs, start and end times, and Laser scores. Each subset has a training set with a certain number of samples and byte sizes.
提供机构:
asahi417
原始信息汇总
数据集概述
本数据集包含多个子集,每个子集具有不同的配置名称和特征。以下是各子集的关键信息概览:
子集详情
-
subset_1
- 特征:
- koA.audio, enA.audio: 音频数据
- line_no: 整数类型
- enA.id, koA.id: 字符串类型
- enA.url, koA.url: 字符串类型
- enA.duration_start, enA.duration_end, koA.duration_start, koA.duration_end: 整数类型
- enA.laser_score, koA.laser_score: 浮点数类型
- 数据量:
- 训练集: 2257个样本,大小为447740670.435字节
- 下载大小: 442797672字节
- 特征:
-
subset_10
- 特征: 同subset_1
- 数据量:
- 训练集: 1975个样本,大小为324418675.275字节
- 下载大小: 316359556字节
-
subset_11
- 特征: 同subset_1
- 数据量:
- 训练集: 1896个样本,大小为296257333.04字节
- 下载大小: 296179564字节
-
subset_12
- 特征: 同subset_1
- 数据量:
- 训练集: 1947个样本,大小为303564230.282字节
- 下载大小: 302942680字节
-
subset_13
- 特征: 同subset_1
- 数据量:
- 训练集: 1983个样本,大小为319322111.078字节
- 下载大小: 322652856字节
-
subset_14
- 特征: 同subset_1
- 数据量:
- 训练集: 1936个样本,大小为309212107.992字节
- 下载大小: 309502226字节
-
subset_15
- 特征: 同subset_1
- 数据量:
- 训练集: 1944个样本,大小为317515713.032字节
- 下载大小: 315786261字节
-
subset_16
- 特征: 同subset_1
- 数据量:
- 训练集: 1871个样本,大小为301196186.941字节
- 下载大小: 298596818字节
-
subset_17
- 特征: 同subset_1
- 数据量:
- 训练集: 1951个样本,大小为321070595.352字节
- 下载大小: 312696816字节
-
subset_18
- 特征: 同subset_1
- 数据量:
- 训练集: 1908个样本,大小为306543817.932字节
- 下载大小: 302340615字节
-
subset_19
- 特征: 同subset_1
- 数据量:
- 训练集: 1940个样本,大小为313159965.78字节
- 下载大小: 312609684字节
-
subset_2
- 特征: 同subset_1
- 数据量:
- 训练集: 2197个样本,大小为433374681.363字节
- 下载大小: 421113868字节
-
subset_20
- 特征: 同subset_1
- 数据量:
- 训练集: 1948个样本,大小为310501329.384字节
- 下载大小: 309842509字节
-
subset_21
- 特征: 同subset_1
- 数据量:
- 训练集: 1933个样本,大小为313745621.131字节
- 下载大小: 312457092字节
-
subset_22
- 特征: 同subset_1
- 数据量:
- 训练集: 1927个样本,大小为309673075.916字节
- 下载大小: 309963355字节
-
subset_23
- 特征: 同subset_1
- 数据量:
- 训练集: 1923个样本,大小为314421571.574字节
- 下载大小: 308263438字节
-
subset_24
- 特征: 同subset_1
- 数据量:
- 训练集: 1941个样本,大小为315332370.035字节
- 下载大小: 316657373字节
-
subset_25
- 特征: 同subset_1
- 数据量:
- 训练集: 1936个样本,大小为322066067.792字节
- 下载大小: 317523643字节
-
subset_26
- 特征: 同subset_1
- 数据量:
- 训练集: 1950个样本,大小为318981177.9字节
- 下载大小: 319324672字节
-
subset_27
- 特征: 同subset_1
- 数据量:
- 训练集: 1929个样本,大小为315281126.509字节
- 下载大小: 314204350字节
-
subset_28
- 特征: 同subset_1
- 数据量:
- 训练集: 1932个样本,大小为306789615.968字节
- 下载大小: 313670576字节
-
subset_29
- 特征: 同subset_1
- 数据量:
- 训练集: 1928个样本,大小为315900924.64字节
- 下载大小: 312959276字节
-
subset_3
- 特征: 同subset_1
- 数据量:
- 训练集: 2067个样本,大小为389989060.674字节
- 下载大小: 380036880字节
-
subset_30
- 特征: 同subset_1
- 数据量:
- 训练集: 1913个样本,大小为316704402.493字节
- 下载大小: 314401706字节
-
subset_31
- 特征: 同subset_1
- 数据量:
- 训练集: 1911个样本,大小为317728963.41字节
- 下载大小: 312816161字节
-
subset_32
- 特征: 同subset_1
- 数据量:
- 训练集: 1915个样本,大小为315488582.995字节
- 下载大小: 316365097字节
-
subset_33
- 特征: 同subset_1
- 数据量:
- 训练集: 1890个样本,大小为320932299.15字节
- 下载大小: 316385130字节
-
subset_34
- 特征: 同subset_1
- 数据量:
- 训练集: 1885个样本,大小为855395167.505字节
- 下载大小: 577087861字节
-
subset_35
- 特征: 同subset_1
- 数据量:
- 训练集: 数据未完整显示,无法提供详细信息
- 下载大小: 数据未完整显示,无法提供详细信息
以上信息为各子集的基本特征和数据量概览。



