Sam04/yt-aud30_1k_par_filtered
收藏Hugging Face2025-11-14 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/Sam04/yt-aud30_1k_par_filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: file_name
dtype: string
- name: folder
dtype: string
- name: transcription
dtype: string
- name: confidence
dtype: string
- name: trim_start_seconds
dtype: float64
- name: trim_end_seconds
dtype: float64
- name: reason_start
dtype: string
- name: reason_end
dtype: string
- name: has_incomplete_words
dtype: bool
- name: notes
dtype: string
- name: original_path
dtype: string
- name: batch_index
dtype: int64
- name: global_index
dtype: int64
splits:
- name: train
num_bytes: 18005933243.526
num_examples: 197169
download_size: 11865350603
dataset_size: 18005933243.526
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征项:
- 名称: 音频(audio)
数据类型:
音频:
采样率: 16000
- 名称: 文件名(file_name)
数据类型: 字符串型
- 名称: 文件夹(folder)
数据类型: 字符串型
- 名称: 转录文本(transcription)
数据类型: 字符串型
- 名称: 置信度(confidence)
数据类型: 字符串型
- 名称: 修剪起始秒数(trim_start_seconds)
数据类型: float64型
- 名称: 修剪结束秒数(trim_end_seconds)
数据类型: float64型
- 名称: 起始原因(reason_start)
数据类型: 字符串型
- 名称: 结束原因(reason_end)
数据类型: 字符串型
- 名称: 存在不完整词汇(has_incomplete_words)
数据类型: 布尔型
- 名称: 备注(notes)
数据类型: 字符串型
- 名称: 原始路径(original_path)
数据类型: 字符串型
- 名称: 批次索引(batch_index)
数据类型: int64型
- 名称: 全局索引(global_index)
数据类型: int64型
数据集划分:
- 划分名称: 训练集(train)
字节大小: 18005933243.526
样本数量: 197169
下载大小: 11865350603
数据集总大小: 18005933243.526
配置项:
- 配置名称: 默认(default)
数据文件:
- 划分: 训练集(train)
路径: data/train-*
提供机构:
Sam04



