DynamicSuperbPrivate/SpokenTermDetection_Tedlium2Train
收藏Hugging Face2023-08-02 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/DynamicSuperbPrivate/SpokenTermDetection_Tedlium2Train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file
dtype: string
- name: audio
dtype: audio
- name: text
dtype: string
- name: instruction
dtype: string
- name: label
dtype: string
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 15786905536.68
num_examples: 92967
- name: validation
num_bytes: 117079048.0
num_examples: 507
download_size: 15262598420
dataset_size: 15903984584.68
---
# Dataset Card for "SpokenTermDetection_Tedlium2Train"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
DynamicSuperbPrivate
原始信息汇总
数据集概述
数据集名称
SpokenTermDetection_Tedlium2Train
数据集特征
- file: 数据类型为字符串。
- audio: 数据类型为音频。
- text: 数据类型为字符串。
- instruction: 数据类型为字符串。
- label: 数据类型为字符串。
- transcription: 数据类型为字符串。
数据集分割
- 训练集: 包含92967个样本,占用15786905536.68字节。
- 验证集: 包含507个样本,占用117079048.0字节。
数据集大小
- 下载大小: 15262598420字节。
- 数据集总大小: 15903984584.68字节。



