five

asahi417/seamless-align-enA-koA

收藏
Hugging Face2024-06-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-koA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个子集,每个子集包含英语和韩语的音频数据及其相关元数据,如音频ID、URL、起始和结束时间以及Laser评分。每个子集都有一个训练集,包含一定数量的样本和字节大小。

This dataset contains multiple subsets, each containing audio data in English and Korean along with related metadata such as audio IDs, URLs, start and end times, and Laser scores. Each subset has a training set with a certain number of samples and byte sizes.
提供机构:
asahi417
原始信息汇总

数据集概述

本数据集包含多个子集,每个子集具有不同的配置名称和特征。以下是各子集的关键信息概览:

子集详情

  1. subset_1

    • 特征:
      • koA.audio, enA.audio: 音频数据
      • line_no: 整数类型
      • enA.id, koA.id: 字符串类型
      • enA.url, koA.url: 字符串类型
      • enA.duration_start, enA.duration_end, koA.duration_start, koA.duration_end: 整数类型
      • enA.laser_score, koA.laser_score: 浮点数类型
    • 数据量:
      • 训练集: 2257个样本,大小为447740670.435字节
      • 下载大小: 442797672字节
  2. subset_10

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1975个样本,大小为324418675.275字节
      • 下载大小: 316359556字节
  3. subset_11

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1896个样本,大小为296257333.04字节
      • 下载大小: 296179564字节
  4. subset_12

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1947个样本,大小为303564230.282字节
      • 下载大小: 302942680字节
  5. subset_13

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1983个样本,大小为319322111.078字节
      • 下载大小: 322652856字节
  6. subset_14

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1936个样本,大小为309212107.992字节
      • 下载大小: 309502226字节
  7. subset_15

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1944个样本,大小为317515713.032字节
      • 下载大小: 315786261字节
  8. subset_16

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1871个样本,大小为301196186.941字节
      • 下载大小: 298596818字节
  9. subset_17

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1951个样本,大小为321070595.352字节
      • 下载大小: 312696816字节
  10. subset_18

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1908个样本,大小为306543817.932字节
      • 下载大小: 302340615字节
  11. subset_19

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1940个样本,大小为313159965.78字节
      • 下载大小: 312609684字节
  12. subset_2

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 2197个样本,大小为433374681.363字节
      • 下载大小: 421113868字节
  13. subset_20

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1948个样本,大小为310501329.384字节
      • 下载大小: 309842509字节
  14. subset_21

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1933个样本,大小为313745621.131字节
      • 下载大小: 312457092字节
  15. subset_22

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1927个样本,大小为309673075.916字节
      • 下载大小: 309963355字节
  16. subset_23

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1923个样本,大小为314421571.574字节
      • 下载大小: 308263438字节
  17. subset_24

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1941个样本,大小为315332370.035字节
      • 下载大小: 316657373字节
  18. subset_25

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1936个样本,大小为322066067.792字节
      • 下载大小: 317523643字节
  19. subset_26

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1950个样本,大小为318981177.9字节
      • 下载大小: 319324672字节
  20. subset_27

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1929个样本,大小为315281126.509字节
      • 下载大小: 314204350字节
  21. subset_28

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1932个样本,大小为306789615.968字节
      • 下载大小: 313670576字节
  22. subset_29

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1928个样本,大小为315900924.64字节
      • 下载大小: 312959276字节
  23. subset_3

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 2067个样本,大小为389989060.674字节
      • 下载大小: 380036880字节
  24. subset_30

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1913个样本,大小为316704402.493字节
      • 下载大小: 314401706字节
  25. subset_31

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1911个样本,大小为317728963.41字节
      • 下载大小: 312816161字节
  26. subset_32

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1915个样本,大小为315488582.995字节
      • 下载大小: 316365097字节
  27. subset_33

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1890个样本,大小为320932299.15字节
      • 下载大小: 316385130字节
  28. subset_34

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 1885个样本,大小为855395167.505字节
      • 下载大小: 577087861字节
  29. subset_35

    • 特征: 同subset_1
    • 数据量:
      • 训练集: 数据未完整显示,无法提供详细信息
      • 下载大小: 数据未完整显示,无法提供详细信息

以上信息为各子集的基本特征和数据量概览。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作