five

英国COVID-19语音音频数据集

收藏
arXiv2023-11-03 更新2024-06-21 收录
下载链接:
https://zenodo.org/doi/10.5281/zenodo.10043977
下载链接
链接失效反馈
官方服务:
资源简介:
英国COVID-19语音音频数据集是由英国卫生安全局创建的大规模PCR参考语音音频数据集,旨在用于训练和评估机器学习模型,以分类SARS-CoV-2感染状态或相关呼吸症状。数据集包含72,999名参与者的音频记录,包括自愿咳嗽、呼气和语音,并链接了SARS-CoV-2测试结果。数据集创建过程中,参与者通过国家测试和追踪计划以及REACT-1调查在英格兰从2021年3月至2022年3月被招募。数据集的应用领域包括生物声学研究和COVID-19筛查,旨在提供一种非侵入性、经济且可扩展的COVID-19监测方法。

The UK COVID-19 Speech Audio Dataset is a large-scale PCR-referenced speech audio dataset developed by the UK Health Security Agency, designed for training and evaluating machine learning models to classify SARS-CoV-2 infection status or related respiratory symptoms. The dataset contains audio recordings from 72,999 participants, including voluntary coughs, exhalations, and speech samples linked to SARS-CoV-2 test results. During the dataset's creation, participants were recruited across England between March 2021 and March 2022 via the National Test and Trace programme and the REACT-1 survey. Its application fields cover bioacoustics research and COVID-19 screening, with the goal of providing a non-invasive, cost-effective and scalable approach for COVID-19 surveillance.
提供机构:
英国卫生安全局
创建时间:
2022-12-15
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
英国COVID-19语音音频数据集是一个大规模的声音音频数据集,用于训练和评估机器学习模型以分类COVID-19感染状态或相关呼吸道症状。数据集包含咳嗽、呼气等音频记录,并与人口统计、症状和PCR测试结果相关联,是目前最大的PCR参考音频记录集合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作