asahi417/seamless-align-enA-esA
收藏Hugging Face2024-06-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-esA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个子集,每个子集包含英语和西班牙语的音频文件及其相关元数据,如音频ID、URL、起始和结束时间以及激光评分。每个子集都有一个训练集,包含字节大小和样本数量。数据集的总下载大小和数据集大小也在每个子集中列出。
The dataset contains multiple subsets, each containing audio files in English and Spanish along with related metadata such as audio IDs, URLs, start and end times, and laser scores. Each subset has a training set with byte size and number of examples. The total download size and dataset size are also listed for each subset.
提供机构:
asahi417
原始信息汇总
数据集概述
子集信息
-
子集名称: subset_1
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2182个样本, 大小412855349.394字节
- 下载大小: 420999058字节
- 数据集大小: 412855349.394字节
- 特征:
-
子集名称: subset_10
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2241个样本, 大小431290833.445字节
- 下载大小: 422088970字节
- 数据集大小: 431290833.445字节
- 特征:
-
子集名称: subset_11
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2242个样本, 大小415466137.922字节
- 下载大小: 420301845字节
- 数据集大小: 415466137.922字节
- 特征:
-
子集名称: subset_12
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2214个样本, 大小422216367.566字节
- 下载大小: 418717962字节
- 数据集大小: 422216367.566字节
- 特征:
-
子集名称: subset_126
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2082个样本, 大小296062150.61字节
- 下载大小: 290445885字节
- 数据集大小: 296062150.61字节
- 特征:
-
子集名称: subset_127
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2120个样本, 大小299460308.52字节
- 下载大小: 296505783字节
- 数据集大小: 299460308.52字节
- 特征:
-
子集名称: subset_128
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2104个样本, 大小296833709.408字节
- 下载大小: 289985904字节
- 数据集大小: 296833709.408字节
- 特征:
-
子集名称: subset_129
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2089个样本, 大小297210016.406字节
- 下载大小: 288784436字节
- 数据集大小: 297210016.406字节
- 特征:
-
子集名称: subset_13
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2230个样本, 大小422761863.97字节
- 下载大小: 417360175字节
- 数据集大小: 422761863.97字节
- 特征:
-
子集名称: subset_130
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2124个样本, 大小300166797.776字节
- 下载大小: 292959634字节
- 数据集大小: 300166797.776字节
- 特征:
-
子集名称: subset_131
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2097个样本, 大小301525008.483字节
- 下载大小: 292928550字节
- 数据集大小: 301525008.483字节
- 特征:
-
子集名称: subset_132
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2100个样本, 大小301380133.5字节
- 下载大小: 293161070字节
- 数据集大小: 301380133.5字节
- 特征:
-
子集名称: subset_133
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2083个样本, 大小295574752.397字节
- 下载大小: 288465605字节
- 数据集大小: 295574752.397字节
- 特征:
-
子集名称: subset_134
- 特征:
- enA.audio (音频)
- esA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2096个样本, 大小309239600.624字节
- 下载大小: 291593658字节
- 数据集大小: 309239600.624字节
- 特征:
-
子集名称: subset_135
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train: 2088个样本, 大小288905611.584字节
- 下载大小: 285422759字节
- 数据集大小: 288905611.584字节
- 特征:
-
子集名称: subset_136
- 特征:
- esA.audio (音频)
- enA.audio (音频)
- line_no (整数)
- enA.id (字符串)
- enA.url (字符串)
- enA.duration_start (整数)
- enA.duration_end (整数)
- enA.laser_score (浮点数)
- esA.id (字符串)
- esA.url (字符串)
- esA.duration_start (整数)
- esA.duration_end (整数)
- esA.laser_score (浮点数)
- 分割:
- train
- 特征:



