MOS-Bench|语音处理数据集|语音质量评估数据集
收藏🗣️ SHEET / MOS-Bench 🎧
数据集概述
- MOS-Bench 是一个用于评估主观语音质量评估(SSQA)模型泛化能力的基准。
- SHEET 是一个用于与 MOS-Bench 进行研究实验的工具包。
关键特性
- MOS-Bench 是首个大规模的 SSQA 训练和测试数据集集合,涵盖了广泛的领域,包括文本到语音(TTS)、语音转换(VC)、歌唱语音合成(SVS)系统生成的合成语音,以及带有人工和真实噪声、剪辑、传输、混响等的失真语音。
- 该仓库旨在提供训练配方。虽然有许多现成的语音质量评估工具,如 DNSMOS、SpeechMOS 和 speechmetrics,但大多数不提供训练配方,因此不适合研究。
MOS-Bench 概览
- MOS-Bench 目前包含 7 个训练集和 12 个测试集。
支持的模型和特性
模型
- LDNet
- 原始仓库链接: https://github.com/unilight/LDNet
- 论文链接: arXiv
- 示例配置:
egs/bvcc/conf/ldnet-ml.yaml
- SSL-MOS
- 原始仓库链接: https://github.com/nii-yamagishilab/mos-finetune-ssl/tree/main
- 论文链接: arXiv
- 示例配置:
egs/bvcc/conf/ssl-mos-wav2vec2.yaml
- 备注: 对原始实现进行了一些修改。
- UTMOS (Strong learner)
- 原始仓库链接: https://github.com/sarulab-speech/UTMOS22/tree/master/strong
- 论文链接: arXiv
- 示例配置:
egs/bvcc/conf/utmos-strong.yaml
- 备注: 未实现 UTMOS strong 的所有组件。
- Modified AlignNet
- 原始仓库链接: https://github.com/NTIA/alignnet
- 论文链接: arXiv
- 示例配置:
egs/bvcc+nisqa+pstn+singmos+somos+tencent+tmhint-qi/conf/alignnet-wav2vec2.yaml
特性
- 建模
- 听众建模
- 基于自监督学习(SSL)的编码器,由 S3PRL 支持
- 训练
- 自动保存最佳模型和早期停止
- 可视化,包括预测分数分布、话语和系统级别分数的散点图
- 模型平均
- 通过堆叠进行模型集成
使用指南
- 新用户:提供完整的实验配方,包括下载和处理数据集、训练和评估模型的脚本。
- 已有模型用户:提供方便的测试集收集脚本。
- 使用预训练模型:通过
torch.hub
提供加载预训练 SSQA 模型并预测分数的功能。
安装
- 通过
git clone
和make
命令进行可编辑安装,自动构建虚拟环境。
信息
- 引用:如果使用该项目中的训练脚本、基准测试脚本或预训练模型,请引用相关论文。
- 致谢:该项目受到 ESPNet 和 ParallelWaveGAN 等仓库的启发。
- 作者:Wen-Chin Huang,Toda Labotorary, Nagoya University。

GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
Oxford 102 Flowers
牛津102花卉数据集是一个主要用于图像分类的花卉集合数据集,分为102个类别,共102种花卉,其中每个类别包含40到258幅图像。 该数据集由牛津大学工程科学系2008年在相关论文 “大量类别上的自动花分类” 中发布
OpenDataLab 收录