covid-cough-detection

Hugging Face2025-11-13 更新2025-11-14 收录

下载链接：

https://huggingface.co/datasets/marceltomas/covid-cough-detection

下载链接

链接失效反馈

官方服务：

资源简介：

COVID-19咳嗽音频数据集是一个经过完全处理的、采用Kaldi风格的版本，用于音频分类、医学音频分析或特征提取管道基准测试的研究人员和从业者。该数据集包括标准化的音频文件（16 kHz）、预计算的DTW距离查找表和几种预计算的特征表示（MFCC、MFSC、Mel频谱图），以支持快速实验。数据集遵循Kaldi风格的目录布局，所有元数据和特征描述符都存储在基于文本的索引文件中。该数据集基于Kaggle竞赛的数据构建，竞赛数据是从Coswara、Cambridge和Coughvid三个不同的数据库中平衡选取的录音。

创建时间：

2025-11-07

原始信息汇总

COVID-19 Cough Audio Dataset (Processed, Kaldi-style) 数据集概述

数据集简介

数据集包含经过完整处理的Kaldi风格COVID-19咳嗽音频数据
用于COVID-19检测项目的研究
适用于音频分类、医学音频分析或特征提取流程基准测试

数据内容

标准化音频文件（16 kHz采样率）
预计算的DTW距离查找表
多种预计算特征表示：
- MFCC（梅尔频率倒谱系数）
- MFSC（梅尔频率频谱系数）
- 梅尔频谱图

数据组织结构

采用Kaldi风格目录布局，所有元数据和特征描述符存储在基于文本的索引文件中

主要目录结构

wavs16k/：所有重采样为16 kHz的音频文件
train/：训练集元数据
- wav.scp：样本ID到音频路径的映射
- text：样本ID到标签（0/1）的映射
test/：测试集元数据
- wav.scp：样本ID到音频路径的映射
- text：样本ID到标签（0/1）的映射
features/：预计算特征
- lookups/dtw_lookup.npy：相似性方法的查找表
- train/：训练样本的预计算特征
- test/：测试样本的预计算特征

数据来源

基于Kaggle竞赛数据，平衡选自三个不同数据库：

Coswara数据库
Cambridge数据库
Coughvid数据库

使用许可

采用MIT许可证
使用时需遵守原始Kaggle竞赛的使用条款

搜集汇总

数据集介绍

构建方式

在医学音频分析领域，该数据集源自Kaggle平台上关于COVID-19咳嗽检测的公开竞赛，通过整合三个权威数据库——Coswara、Cambridge和Coughvid的咳嗽录音构建而成。数据经过精心筛选与平衡处理，确保样本的代表性与多样性，所有音频文件统一重采样至16kHz标准频率，并采用Kaldi风格目录结构进行组织，便于系统化存储与管理。

特点

该数据集的核心特点在于其丰富的预计算特征表示，包括梅尔频率倒谱系数、梅尔频谱图等多种声学特征，同时提供动态时间规整距离查找表以支持相似性分析方法。数据集严格划分训练与测试子集，每个样本均标注明确的健康或感染状态标签，为医学音频分类研究提供了高一致性的基准数据。

使用方法

研究人员可通过解析wav.scp和text索引文件快速定位音频路径与对应标签，直接调用预计算特征目录中的多维声学特征矩阵进行模型训练。该数据集兼容主流音频处理框架，支持端到端的特征提取流程验证，特别适用于咳嗽音分类算法的性能评估与跨数据库泛化能力测试。

背景与挑战

背景概述

随着全球新冠疫情的蔓延，2020年起科研机构开始探索非侵入式诊断方法，基于音频的COVID-19检测技术应运而生。该数据集由研究团队整合自Coswara、剑桥大学和Coughvid三大公开数据库，通过Kaggle平台构建标准化咳嗽音频库。其核心目标在于利用声学特征识别新冠肺炎感染者，为医疗音频分析领域提供了首个融合多源数据的基准测试资源，推动了智能诊断工具在公共卫生危机中的实际应用。

当前挑战

该数据集致力于解决咳嗽音频分类中疾病特征与健康差异的区分难题，具体涉及声学信号在病理状态下的微弱模式捕捉。构建过程中面临多源数据融合的挑战：原始录音设备与环境的异质性导致声学特征漂移，需通过重采样与特征对齐实现标准化；同时隐私保护要求限制了原始音频的完整访问，迫使研究者依赖预处理后的特征矩阵进行模型开发。

常用场景

经典使用场景

在医疗音频分析领域，该数据集为咳嗽声音的自动检测与分类提供了标准化实验平台。研究者可借助其预计算的特征表示（如MFCC和梅尔频谱图）快速构建深度学习模型，用于区分COVID-19感染者与健康人群的咳嗽声学模式。其Kaldi风格的数据结构进一步简化了语音特征提取流程，成为声学生物标志物研究的基准工具。

实际应用

在实际医疗场景中，该数据集支撑的咳嗽分类模型可部署于远程筛查系统，实现社区级疫情监测。通过智能手机采集的咳嗽音频经模型分析后，能快速生成感染风险评估，辅助医疗资源调配。这种非侵入式诊断方法尤其适用于医疗基础设施薄弱地区，为公共卫生应急响应提供技术保障。

衍生相关工作

基于该数据集衍生的研究推动了多模态医疗诊断的发展。剑桥大学团队结合声学特征与临床症状开发出混合诊断模型，而MIT团队则利用其DTW查找表优化了时序模式识别算法。这些工作不仅完善了COVID-19的声学检测体系，更为肺炎、哮喘等呼吸道疾病的智能诊断开辟了新路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集