asahi417/seamless-align-enA-est
收藏Hugging Face2024-06-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/seamless-align-enA-est
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个子集,每个子集包含音频数据、文本数据、ID、URL、时间戳和激光评分等信息。数据集主要用于训练模型,可能涉及音频与文本的关联分析或其他相关任务。
This dataset contains multiple subsets, each including audio data, text data, IDs, URLs, timestamps, and laser scores. The dataset is primarily used for training models, potentially involving tasks related to audio-text correlation analysis or other related applications.
提供机构:
asahi417
原始信息汇总
数据集概述
数据集配置名称及特征
-
subset_1
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 79976607.92
- num_examples: 2080
- train
- 下载大小: 78979220
- 数据集大小: 79976607.92
- 特征:
-
subset_10
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 84479246.395
- num_examples: 1957
- train
- 下载大小: 83089941
- 数据集大小: 84479246.395
- 特征:
-
subset_100
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 66384974.999
- num_examples: 1997
- train
- 下载大小: 65671634
- 数据集大小: 66384974.999
- 特征:
-
subset_101
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69795580.848
- num_examples: 2008
- train
- 下载大小: 67805957
- 数据集大小: 69795580.848
- 特征:
-
subset_102
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 72123586.712
- num_examples: 2034
- train
- 下载大小: 69468000
- 数据集大小: 72123586.712
- 特征:
-
subset_103
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69890735.449
- num_examples: 2043
- train
- 下载大小: 70305115
- 数据集大小: 69890735.449
- 特征:
-
subset_104
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 68914528.532
- num_examples: 2031
- train
- 下载大小: 67199995
- 数据集大小: 68914528.532
- 特征:
-
subset_105
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 68868325.587
- num_examples: 2031
- train
- 下载大小: 68650124
- 数据集大小: 68868325.587
- 特征:
-
subset_106
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69262201.816
- num_examples: 2032
- train
- 下载大小: 67551224
- 数据集大小: 69262201.816
- 特征:
-
subset_107
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 68233206.29
- num_examples: 2007
- train
- 下载大小: 68337451
- 数据集大小: 68233206.29
- 特征:
-
subset_108
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 70877408.666
- num_examples: 2003
- train
- 下载大小: 67760827
- 数据集大小: 70877408.666
- 特征:
-
subset_109
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69614600.916
- num_examples: 2042
- train
- 下载大小: 68432121
- 数据集大小: 69614600.916
- 特征:
-
subset_11
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 89385078.503
- num_examples: 2107
- train
- 下载大小: 88017953
- 数据集大小: 89385078.503
- 特征:
-
subset_110
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69210261.58
- num_examples: 2021
- train
- 下载大小: 67116970
- 数据集大小: 69210261.58
- 特征:
-
subset_111
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69788732.202
- num_examples: 2019
- train
- 下载大小: 67839470
- 数据集大小: 69788732.202
- 特征:
-
subset_112
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 68458562.416
- num_examples: 2016
- train
- 下载大小: 66826809
- 数据集大小: 68458562.416
- 特征:
-
subset_113
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69492017.466
- num_examples: 2026
- train
- 下载大小: 68266554
- 数据集大小: 69492017.466
- 特征:
-
subset_114
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 70642802.378
- num_examples: 2038
- train
- 下载大小: 67218476
- 数据集大小: 70642802.378
- 特征:
-
subset_115
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 69688742.124
- num_examples: 2028
- train
- 下载大小: 68307107
- 数据集大小: 69688742.124
- 特征:
-
subset_116
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int64)
- est.text (dtype: string)
- enA.id (dtype: string)
- enA.url (dtype: string)
- enA.duration_start (dtype: int64)
- enA.duration_end (dtype: int64)
- enA.laser_score (dtype: string)
- 分割:
- train
- num_bytes: 67916574.99000001
- num_examples: 2031
- train
- 下载大小: 66197582
- 数据集大小: 67916574.99000001
- 特征:
-
subset_117
- 特征:
- enA.audio (dtype: audio)
- line_no (dtype: int6
- 特征:



