atc-voxtral-no-confidence-filter
收藏Hugging Face2026-03-20 更新2026-03-21 收录
下载链接:
https://huggingface.co/datasets/Trelis/atc-voxtral-no-confidence-filter
下载链接
链接失效反馈官方服务:
资源简介:
atc-voxtral-no-confidence-filter 是一个由 Trelis Studio 准备的语音数据集。该数据集包含 2 个源文件,13 个训练样本,总时长为 3.5 分钟。数据集中的列包括音频段(16kHz)、纯文本转录、带有 Whisper 时间戳标记的转录、前一段的纯文本(用于第一段则为空)、原始音频中的片段开始和结束时间、语音持续时间(不包括静音)、单词级时间戳(相对于仅语音的音频)、原始音频文件名以及 Whisper 语言标记的 ISO 639-1 语言代码。语音分割过程对于 .txt 转录使用 CTC 对齐生成单词级时间戳来定义语音边界,而对于 .srt/.vtt 文件则使用转录时间戳定义片段。训练使用提供了两种方法:默认的 2-bucket 方法和包含预处理的 4-bucket 方法,其中预处理通过添加上一段的文本来教授模型对话连续性。数据集可通过 HuggingFace 的 datasets 库加载使用。
提供机构:
Trelis
创建时间:
2026-03-20



