five

asahi417/seamless-align-enA-est

收藏
Hugging Face2024-06-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-est
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个子集,每个子集包含音频数据、文本数据、ID、URL、时间戳和激光评分等信息。数据集主要用于训练模型,可能涉及音频与文本的关联分析或其他相关任务。

This dataset contains multiple subsets, each including audio data, text data, IDs, URLs, timestamps, and laser scores. The dataset is primarily used for training models, potentially involving tasks related to audio-text correlation analysis or other related applications.
提供机构:
asahi417
原始信息汇总

数据集概述

数据集配置名称及特征

  • subset_1

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 79976607.92
        • num_examples: 2080
    • 下载大小: 78979220
    • 数据集大小: 79976607.92
  • subset_10

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 84479246.395
        • num_examples: 1957
    • 下载大小: 83089941
    • 数据集大小: 84479246.395
  • subset_100

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 66384974.999
        • num_examples: 1997
    • 下载大小: 65671634
    • 数据集大小: 66384974.999
  • subset_101

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69795580.848
        • num_examples: 2008
    • 下载大小: 67805957
    • 数据集大小: 69795580.848
  • subset_102

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 72123586.712
        • num_examples: 2034
    • 下载大小: 69468000
    • 数据集大小: 72123586.712
  • subset_103

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69890735.449
        • num_examples: 2043
    • 下载大小: 70305115
    • 数据集大小: 69890735.449
  • subset_104

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 68914528.532
        • num_examples: 2031
    • 下载大小: 67199995
    • 数据集大小: 68914528.532
  • subset_105

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 68868325.587
        • num_examples: 2031
    • 下载大小: 68650124
    • 数据集大小: 68868325.587
  • subset_106

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69262201.816
        • num_examples: 2032
    • 下载大小: 67551224
    • 数据集大小: 69262201.816
  • subset_107

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 68233206.29
        • num_examples: 2007
    • 下载大小: 68337451
    • 数据集大小: 68233206.29
  • subset_108

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 70877408.666
        • num_examples: 2003
    • 下载大小: 67760827
    • 数据集大小: 70877408.666
  • subset_109

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69614600.916
        • num_examples: 2042
    • 下载大小: 68432121
    • 数据集大小: 69614600.916
  • subset_11

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 89385078.503
        • num_examples: 2107
    • 下载大小: 88017953
    • 数据集大小: 89385078.503
  • subset_110

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69210261.58
        • num_examples: 2021
    • 下载大小: 67116970
    • 数据集大小: 69210261.58
  • subset_111

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69788732.202
        • num_examples: 2019
    • 下载大小: 67839470
    • 数据集大小: 69788732.202
  • subset_112

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 68458562.416
        • num_examples: 2016
    • 下载大小: 66826809
    • 数据集大小: 68458562.416
  • subset_113

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69492017.466
        • num_examples: 2026
    • 下载大小: 68266554
    • 数据集大小: 69492017.466
  • subset_114

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 70642802.378
        • num_examples: 2038
    • 下载大小: 67218476
    • 数据集大小: 70642802.378
  • subset_115

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 69688742.124
        • num_examples: 2028
    • 下载大小: 68307107
    • 数据集大小: 69688742.124
  • subset_116

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int64)
      • est.text (dtype: string)
      • enA.id (dtype: string)
      • enA.url (dtype: string)
      • enA.duration_start (dtype: int64)
      • enA.duration_end (dtype: int64)
      • enA.laser_score (dtype: string)
    • 分割:
      • train
        • num_bytes: 67916574.99000001
        • num_examples: 2031
    • 下载大小: 66197582
    • 数据集大小: 67916574.99000001
  • subset_117

    • 特征:
      • enA.audio (dtype: audio)
      • line_no (dtype: int6
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作