five

kjetMol/ArtificiallyNoisySpeechTranscriptions

收藏
Hugging Face2024-05-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/kjetMol/ArtificiallyNoisySpeechTranscriptions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自Språkbanken提供的挪威语语料库中nb_samtale子集的语音文件转录。这些转录文件经过了受控的噪声添加,以模拟不同的声学环境。原始音频的持续时间为24秒到27秒,格式为WAV,共有9个文件。转录部分测试了3个模型、4种噪声类型和16个噪声级别,总文件数为1682个。单词错误率(WER)用于评估语音识别系统在不同噪声条件下的性能,计算基于0%噪声添加的转录作为基准。

该数据集包含来自Språkbanken提供的挪威语语料库中nb_samtale子集的语音文件转录。这些转录文件经过了受控的噪声添加,以模拟不同的声学环境。原始音频的持续时间为24秒到27秒,格式为WAV,共有9个文件。转录部分测试了3个模型、4种噪声类型和16个噪声级别,总文件数为1682个。单词错误率(WER)用于评估语音识别系统在不同噪声条件下的性能,计算基于0%噪声添加的转录作为基准。
提供机构:
kjetMol
原始信息汇总

数据集概述

数据来源

  • 语言:挪威语
  • 来源:Språkbanken 提供的 nb_samtale 子集

数据内容

  • 原始音频属性

    • 时长:24秒至27秒
    • 格式:WAV
    • 文件数量:9个
  • 转录信息

    • 测试模型数量:3个
    • 测试噪音类型:4种
    • 噪音级别数量:16个
    • 总文件数量:1682个

评估指标

  • 词错误率(WER):基于未添加噪音的转录文本作为基准,评估在不同噪音条件下的语音识别系统性能。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作