five

asahi417/seamless-align-enA-esA

收藏
Hugging Face2024-06-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-esA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个子集,每个子集包含英语和西班牙语的音频文件及其相关元数据,如音频ID、URL、起始和结束时间以及激光评分。每个子集都有一个训练集,包含字节大小和样本数量。数据集的总下载大小和数据集大小也在每个子集中列出。

The dataset contains multiple subsets, each containing audio files in English and Spanish along with related metadata such as audio IDs, URLs, start and end times, and laser scores. Each subset has a training set with byte size and number of examples. The total download size and dataset size are also listed for each subset.
提供机构:
asahi417
原始信息汇总

数据集概述

子集信息

  1. 子集名称: subset_1

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2182个样本, 大小412855349.394字节
    • 下载大小: 420999058字节
    • 数据集大小: 412855349.394字节
  2. 子集名称: subset_10

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2241个样本, 大小431290833.445字节
    • 下载大小: 422088970字节
    • 数据集大小: 431290833.445字节
  3. 子集名称: subset_11

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2242个样本, 大小415466137.922字节
    • 下载大小: 420301845字节
    • 数据集大小: 415466137.922字节
  4. 子集名称: subset_12

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2214个样本, 大小422216367.566字节
    • 下载大小: 418717962字节
    • 数据集大小: 422216367.566字节
  5. 子集名称: subset_126

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2082个样本, 大小296062150.61字节
    • 下载大小: 290445885字节
    • 数据集大小: 296062150.61字节
  6. 子集名称: subset_127

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2120个样本, 大小299460308.52字节
    • 下载大小: 296505783字节
    • 数据集大小: 299460308.52字节
  7. 子集名称: subset_128

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2104个样本, 大小296833709.408字节
    • 下载大小: 289985904字节
    • 数据集大小: 296833709.408字节
  8. 子集名称: subset_129

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2089个样本, 大小297210016.406字节
    • 下载大小: 288784436字节
    • 数据集大小: 297210016.406字节
  9. 子集名称: subset_13

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2230个样本, 大小422761863.97字节
    • 下载大小: 417360175字节
    • 数据集大小: 422761863.97字节
  10. 子集名称: subset_130

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2124个样本, 大小300166797.776字节
    • 下载大小: 292959634字节
    • 数据集大小: 300166797.776字节
  11. 子集名称: subset_131

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2097个样本, 大小301525008.483字节
    • 下载大小: 292928550字节
    • 数据集大小: 301525008.483字节
  12. 子集名称: subset_132

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2100个样本, 大小301380133.5字节
    • 下载大小: 293161070字节
    • 数据集大小: 301380133.5字节
  13. 子集名称: subset_133

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2083个样本, 大小295574752.397字节
    • 下载大小: 288465605字节
    • 数据集大小: 295574752.397字节
  14. 子集名称: subset_134

    • 特征:
      • enA.audio (音频)
      • esA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2096个样本, 大小309239600.624字节
    • 下载大小: 291593658字节
    • 数据集大小: 309239600.624字节
  15. 子集名称: subset_135

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train: 2088个样本, 大小288905611.584字节
    • 下载大小: 285422759字节
    • 数据集大小: 288905611.584字节
  16. 子集名称: subset_136

    • 特征:
      • esA.audio (音频)
      • enA.audio (音频)
      • line_no (整数)
      • enA.id (字符串)
      • enA.url (字符串)
      • enA.duration_start (整数)
      • enA.duration_end (整数)
      • enA.laser_score (浮点数)
      • esA.id (字符串)
      • esA.url (字符串)
      • esA.duration_start (整数)
      • esA.duration_end (整数)
      • esA.laser_score (浮点数)
    • 分割:
      • train
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作