five

resp-agent-dataset

收藏
Hugging Face2026-02-16 更新2026-02-17 收录
下载链接:
https://huggingface.co/datasets/AustinZhang/resp-agent-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Resp-229K 是一个大规模呼吸音数据集,包含229,101个音频文件,总时长超过407小时。该数据集专为训练Resp-Agent系统(智能呼吸音分析与生成框架)而构建。数据集包含训练集(196,654个样本)、验证集(16,931个样本)和测试集(15,516个样本),平均音频时长为6.41秒。音频采样率主要为48000Hz(占85.67%)和44100Hz(占12.52%)。数据集整合了来自多个机构的呼吸音数据,包括UK COVID-19、COUGHVID、ICBHI等,各子数据集保留其原始许可协议。数据集包含AI生成的呼吸音描述文件(audio_descriptions.jsonl),记录音频特征、疾病标签等信息。该数据集适用于音频分类任务,特别是呼吸音识别、咳嗽检测等医疗音频分析场景,发布许可为CC BY-NC 4.0,仅限学术研究使用。
创建时间:
2026-02-08
搜集汇总
数据集介绍
构建方式
在呼吸音分析领域,数据集的构建质量直接决定了模型的泛化能力。Resp-229K数据集通过整合六个权威的公开呼吸音数据集,包括UK COVID-19、COUGHVID、ICBHI等,构建了一个规模庞大的集合。其构建过程遵循严格的筛选标准,确保了229,101个有效音频文件的纳入,总时长超过407小时。数据集已预先划分为训练集、验证集和测试集,并包含一个由人工智能生成的详细音频描述文件,该文件移除了低置信度的内容,为多模态分析提供了结构化文本支持。
特点
该数据集的核心特征在于其规模与多样性。作为目前最大的公开呼吸音数据集之一,它涵盖了多种采样率,其中48kHz的音频占比超过85%,确保了高保真度。数据来源广泛,涉及不同机构与地理区域,增强了样本的代表性。特别值得注意的是,数据集附带的描述文件为每个音频提供了临床观察细节,如录音位置、设备信息以及是否存在爆裂音或哮鸣音,这为结合音频与文本的多模态研究创造了条件。其严格的测试集划分,确保了模型评估的独立性与可靠性。
使用方法
为便于研究使用,数据集以压缩包形式提供,用户可通过Hugging Face Hub便捷下载。下载后,解压文件即可获得按训练、验证、测试划分的目录结构。研究者需在配置文件中指定相应的数据路径,以接入模型训练流程。数据集主要服务于呼吸音分类、疾病诊断及多模态生成等任务。其配套的论文与代码库提供了完整的系统实现参考,鼓励用户在遵守CC BY-NC 4.0许可的前提下,将其用于非商业的学术探索。
背景与挑战
背景概述
Resp-229K数据集是2026年由香港科技大学(广州)等机构的研究团队为支持Resp-Agent智能呼吸音分析系统而构建的大规模呼吸音数据集。该数据集整合了来自英国卫生安全局、洛桑联邦理工学院、ICBHI挑战赛等多个权威机构的公开数据,共包含超过22.9万条有效音频,总时长约408小时,旨在为呼吸系统疾病的音频辅助诊断提供高质量的训练与评估资源。其核心研究问题聚焦于通过多模态学习实现呼吸音的自动分析与生成,以应对COVID-19、慢性阻塞性肺疾病等呼吸道疾病的早期筛查与监测需求,对推动医疗人工智能在听诊数字化领域的应用具有重要影响力。
当前挑战
该数据集致力于解决呼吸音自动分类与疾病诊断中的关键挑战,包括呼吸音信号的高变异性、环境噪声干扰、以及不同疾病间声学特征的细微差异所导致的模型泛化困难。在构建过程中,研究团队面临多源数据整合的复杂性,需协调来自六种不同采集设备、采样率及许可协议的数据,并确保临床标注的一致性。此外,生成高质量的音频描述文件需克服大型语言模型可能产生的伪影与标签冲突,以维持医学描述的准确性与可靠性。
常用场景
经典使用场景
在呼吸音分析领域,Resp-229K数据集为训练和评估智能诊断模型提供了关键支持。其核心应用场景在于构建端到端的呼吸音分类与生成系统,例如Resp-Agent框架,通过大规模标注的音频样本,系统能够学习识别咳嗽、喘鸣、爆裂音等异常呼吸模式,进而辅助自动化疾病筛查。该数据集整合了多源临床数据,确保了模型在复杂声学环境下的泛化能力,为呼吸系统疾病的早期检测奠定了数据基础。
实际应用
在实际医疗场景中,Resp-229K数据集支撑着智能听诊设备的开发与远程健康监测系统的构建。基于该数据训练的模型可嵌入移动应用或可穿戴设备,实现居家环境下的呼吸异常实时检测,尤其适用于慢性阻塞性肺疾病、哮喘或COVID-19相关症状的持续追踪。这种技术能够减轻医疗机构的筛查负担,为资源匮乏地区提供便捷的初步诊断工具,提升呼吸系统健康管理的可及性与效率。
衍生相关工作
围绕Resp-229K数据集,已衍生出多项经典研究工作,其中最具代表性的是Resp-Agent系统,该系统利用多智能体框架实现呼吸音的生成与疾病诊断。此外,数据集被广泛用于探索呼吸音的分类算法优化、跨域适应模型以及合成数据生成方法。这些工作不仅深化了对呼吸声学模式的理解,还促进了开源医疗音频工具链的发展,为后续呼吸音分析领域的模型创新提供了可靠的基准与灵感源泉。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作