atc-draft-no-confidence-filter
收藏Hugging Face2026-03-20 更新2026-03-21 收录
下载链接:
https://huggingface.co/datasets/Trelis/atc-draft-no-confidence-filter
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个语音数据集,名为'atc-draft-no-confidence-filter',由Trelis Studio准备。数据集包含从对齐区域提取的语音片段,采样率为16kHz。数据集提供了丰富的字段信息,包括音频片段、纯文本转录、带时间戳的转录、前一段落的文本(用于上下文连贯性)、片段在原音频中的起止时间、语音持续时间、词级时间戳、原始音频文件名以及语言代码。数据集总共有2个源文件,12个训练样本,总时长为3.5分钟。数据集适用于语音识别和语音处理任务,特别是那些需要时间戳和上下文连贯性的场景。训练时可以采用两种方法:一种是默认的2-bucket方法,另一种是包含预条件处理的4-bucket方法,旨在教授模型对话的连续性。
提供机构:
Trelis
创建时间:
2026-03-20



