synthetic-cough
收藏Synthetic Cough Audio Dataset
概述
该数据集包含91,434个使用Stability AI的Stable Audio模型生成的合成人类咳嗽样本。这是一个革命性的超现实合成咳嗽音频集合,旨在协助研究人员在呼吸生物标志物、听觉组学和语音生物标志物方面的工作。
数据集详情
- 总样本数: 91,434
- 音频格式: Ogg Vorbis (libvorbis)
- 采样率: 16 kHz
- 声道: 单声道
- 时长: 每个样本最多12秒
生成过程
Stable Audio模型通过各种咳嗽描述来生成多样化的合成咳嗽声音,代表不同年龄、性别和咳嗽类型。
技术细节
- 模型: Stability AI的Stable Audio Open 1.0
- 生成参数:
- 步数: 100
- CFG Scale: 7
- Sigma Min: 0.3
- Sigma Max: 500
- 采样器类型: dpmpp-3m-sde
预期用途
该数据集旨在用于以下研究目的:
- 呼吸生物标志物
- 听觉组学
- 语音生物标志物
- 咳嗽音频事件检测
它提供了一个大规模、多样化的合成咳嗽集合,可用于训练和验证机器学习模型,而无需担心与真实患者数据相关的隐私问题。
重要注意事项
合成性质和健康状况: 尽管这个合成数据集被设计为健康对照数据,但它仍可能再现各种呼吸状况中出现的模式。
鼓励研究人员探索创新方法,将这个合成数据集与现实世界数据结合使用,以通过AI推进呼吸健康分析领域。
伦理考虑
虽然该数据集为研究提供了宝贵的资源,但用户应注意:
- 这些是合成样本,可能无法完美代表现实世界的咳嗽声音。
- 该数据集应与现实世界数据结合使用,以进行全面研究。
- 任何部署的模型都应在临床使用前通过多样化的现实世界数据进行彻底验证。
引用
如果您在研究中使用此数据集,请引用:
Kirdey, S., Amplifier Health Inc. (2024). Synthetic Cough dataset - thousands of realistic cough produced by generative AI.
对于BibTeX用户:
bibtex @misc{kirdey2024syntheticcough, author = {Kirdey, Stanislav}, title = {Synthetic Cough dataset - thousands of realistic cough produced by generative AI}, year = {2024}, publisher = {Amplifier Health Inc.}, howpublished = {url{https://www.amplifierhealth.com}}, note = {Accessed: YYYY-MM-DD} }
许可证
Stability AI社区许可证(https://huggingface.co/stabilityai/stable-audio-open-1.0/blob/main/LICENSE.md)




