five

atc-draft-no-confidence-filter

收藏
Hugging Face2026-03-20 更新2026-03-21 收录
下载链接:
https://huggingface.co/datasets/Trelis/atc-draft-no-confidence-filter
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个语音数据集,名为'atc-draft-no-confidence-filter',由Trelis Studio准备。数据集包含从对齐区域提取的语音片段,采样率为16kHz。数据集提供了丰富的字段信息,包括音频片段、纯文本转录、带时间戳的转录、前一段落的文本(用于上下文连贯性)、片段在原音频中的起止时间、语音持续时间、词级时间戳、原始音频文件名以及语言代码。数据集总共有2个源文件,12个训练样本,总时长为3.5分钟。数据集适用于语音识别和语音处理任务,特别是那些需要时间戳和上下文连贯性的场景。训练时可以采用两种方法:一种是默认的2-bucket方法,另一种是包含预条件处理的4-bucket方法,旨在教授模型对话的连续性。
提供机构:
Trelis
创建时间:
2026-03-20
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作