DynamicSuperbPrivate/SpokenTermDetection_LibrispeechTrainClean100
收藏Hugging Face2023-07-12 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/DynamicSuperbPrivate/SpokenTermDetection_LibrispeechTrainClean100
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file
dtype: string
- name: audio
dtype: audio
- name: text
dtype: string
- name: instruction
dtype: string
- name: label
dtype: string
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 6373730811.671
num_examples: 28539
- name: validation
num_bytes: 348367644.844
num_examples: 2703
download_size: 6775627104
dataset_size: 6722098456.514999
---
# Dataset Card for "speechTermDetection_LibrispeechTrainClean100"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
DynamicSuperbPrivate
原始信息汇总
数据集概述
特征信息
- file: 数据类型为字符串。
- audio: 数据类型为音频。
- text: 数据类型为字符串。
- instruction: 数据类型为字符串。
- label: 数据类型为字符串。
- transcription: 数据类型为字符串。
数据分割
- train: 包含28539个样本,总字节数为6373730811.671。
- validation: 包含2703个样本,总字节数为348367644.844。
数据大小
- 下载大小: 6775627104字节。
- 数据集大小: 6722098456.514999字节。



