speech-nlp-datasets|语音处理数据集|健康分析数据集

github2020-09-28 更新2024-05-31 收录

语音处理

健康分析

下载链接：

https://github.com/SefaKonac1/speech-nlp-datasets

下载链接

链接失效反馈

资源简介：

包含用于使用语音和语言建模健康结果的公开可用数据集链接。

Includes links to publicly available datasets for using speech and language modeling to predict health outcomes.

创建时间：

2020-09-28

原始信息汇总

数据集概述

语音数据集

Speech Database of Typical Children and Children with SLI
- 包含103名母语为捷克语的特定语言障碍儿童。
- 链接：Corpus
mPower Study, Parkinsons Disease Data
- 包含超过800名帕金森病患者（包括对照组）的语音、步行、敲击和记忆的结构化移动电话测试录音。
- 链接：Corpus
Distress Analysis Interview Corpus
- 包含189个20分钟长的与虚拟代理的访谈录音，涉及抑郁严重程度的二元和多类标签。
- 链接：Corpus
Oxford LSVT Voice Rehabilitation Data Set
- 包含14名帕金森病患者的语音康复评估数据。
- 链接：Corpus
Spanish Parkinson Corpus
- 包含50名不同严重程度的帕金森病西班牙语患者。
- 联系作者获取数据集。
Parkinson Speech Dataset with Multiple Types of Sound Recordings Data Set
- 包含40名参与者（包括20名对照组）的语音记录，来自土耳其。
- 链接：Corpus
Mobile Device Voice Recordings at Kings College London (MDVR-KCL)
- 包含早期和晚期帕金森病患者及健康对照组的移动设备语音记录。
- 链接：Corpus
Dem@Care
- 包含希腊痴呆患者的音频、视频和生理信号数据。
- 链接：Corpus
TORGO Databse
- 包含7名患有脑瘫或肌萎缩侧索硬化症的患者的语音和发音数据。
- 链接：Corpus
Child Pathological Speech Database (CPSD)
- 包含99名自闭症谱系或语言障碍儿童的语音记录。
- 联系作者获取数据集。
Saarbruecken Voice Database
- 包含超过2,000人的语音记录，每个记录都有相关的EEG信号。
- 链接：Corpus
ALS Voice Data Set
- 包含54名演讲者的语音记录，包括39名健康演讲者和15名ALS患者。
- 链接：Corpus

文本数据集

MIMIC III
- 包含超过40,000名患者的医疗详细信息和结果，包括200万+自由文本医疗笔记。
- 链接：Corpus
i2b2/UTHealth NLP Task
- 包含296名患者的紧急医疗记录，包括医疗放电和通信笔记。
- 联系作者获取数据集。
Nun Study
- 包含93名修女的日记，用于评估晚年的认知障碍（阿尔茨海默病）。
- 联系作者获取数据集。

AI搜集汇总

数据集介绍

构建方式

该数据集的构建基于多个公开的语音和文本语料库，涵盖了从儿童语言障碍到帕金森病等多种健康相关的研究领域。每个语料库均通过严格的实验设计和数据采集流程构建，例如通过结构化移动电话测试收集帕金森病患者的语音数据，或通过虚拟代理进行抑郁严重性评估的访谈录音。这些数据来源多样，包括临床实验、家庭环境监测以及大规模医疗记录，确保了数据的广泛性和代表性。

使用方法

该数据集的使用方法灵活多样，适用于多种研究场景。研究人员可以通过访问公开的语料库链接获取原始数据，并根据研究需求进行预处理和分析。例如，可以利用语音数据训练深度学习模型以识别特定疾病的语音特征，或结合文本数据开发自然语言处理工具以辅助医疗诊断。此外，数据集中的多模态数据支持跨领域研究，如结合语音和面部特征进行情感分析。使用该数据集时，建议遵循各语料库的引用规范，以确保研究的透明性和可重复性。

背景与挑战

背景概述

speech-nlp-datasets 数据集汇集了多个公开可用的语音和自然语言处理数据集，旨在通过语音和语言建模来预测健康结果。该数据集由多个研究机构和学者共同创建，涵盖了从儿童语言障碍到帕金森病、痴呆症等多种健康问题的语音数据。例如，Grill 等人（2016）创建的捷克儿童语言障碍数据库，以及 Bot 等人（2016）发布的 mPower 研究数据集，均是该领域的重要贡献。这些数据集不仅为研究者提供了丰富的语音和文本数据，还推动了语音分析技术在医疗健康领域的应用，特别是在疾病早期诊断和病情监测方面。

当前挑战

speech-nlp-datasets 数据集面临的挑战主要体现在两个方面。首先，语音数据的多样性和复杂性使得模型训练和特征提取变得困难，尤其是在处理不同语言、口音和病理特征时。其次，数据集的构建过程中，隐私保护和伦理问题尤为突出，特别是在涉及患者敏感信息时，如何确保数据的匿名化和合规使用成为一大难题。此外，数据标注的一致性和质量也直接影响模型的性能，而多模态数据（如语音、文本、面部表情）的融合分析进一步增加了技术难度。这些挑战要求研究者在数据处理、模型设计和伦理规范方面进行深入探索。

常用场景

经典使用场景

在语音和自然语言处理领域，speech-nlp-datasets数据集被广泛应用于健康结果的建模研究。该数据集包含了多种语音和文本语料库，特别适用于分析特定语言障碍、帕金森病、抑郁症等健康问题的语音特征。研究者可以通过这些数据，深入探讨语音信号与疾病之间的关联，进而开发出基于语音的疾病诊断和监测工具。

解决学术问题

speech-nlp-datasets数据集为学术界提供了丰富的语音和文本数据，解决了多个健康相关的研究问题。例如，通过分析帕金森病患者的语音特征，研究者能够识别疾病的早期症状，并评估治疗效果。此外，该数据集还支持抑郁症、痴呆症等精神健康问题的研究，帮助开发自动化的情感分析和疾病监测系统。这些研究不仅推动了语音信号处理技术的发展，还为临床医学提供了新的诊断工具。

实际应用

在实际应用中，speech-nlp-datasets数据集为医疗健康领域提供了重要的技术支持。例如，基于该数据集开发的语音分析工具可以用于远程监测帕金森病患者的病情进展，帮助医生及时调整治疗方案。此外，该数据集还被用于开发智能虚拟助手，通过与患者的语音交互，评估其心理健康状态，并提供个性化的干预建议。这些应用不仅提高了医疗服务的效率，还为患者提供了更加便捷的健康管理方式。

数据集最近研究

最新研究方向

近年来，speech-nlp-datasets在语音与自然语言处理领域的研究方向主要集中在基于语音的疾病诊断与健康监测。通过分析特定语言障碍（SLI）、帕金森病、抑郁症等疾病的语音特征，研究者能够开发出更为精准的诊断工具。例如，mPower Study和Oxford LSVT Voice Rehabilitation数据集被广泛用于帕金森病的早期检测与康复效果评估。此外，Distress Analysis Interview Corpus在抑郁症严重程度的多分类标签研究中展现了其独特价值。这些数据集不仅推动了语音识别与情感计算技术的进步，还为个性化医疗和远程健康监测提供了重要支持。随着深度学习与多模态融合技术的快速发展，基于语音的疾病预测模型正逐渐成为医疗健康领域的前沿热点。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取；气象实测数据从气象站获取，气象站建于电站30号箱变附近，每5分钟将采集的数据通过光纤传输到机房；数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统（包括30TF计算刀片机、250TB并行存储）进行中尺度模式计算后输出预报产品，每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心收录

AgiBot World

为了进一步推动通用具身智能领域研究进展，让高质量机器人数据触手可及，作为上海模塑申城语料普惠计划中的一份子，智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思，重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目，旨在构建国际领先的开源技术底座，标志着具身智能领域「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集，AgiBot World 的长程数据规模高出 10 倍，场景范围覆盖面扩大 100 倍，数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能，从抓取、放置、推、拉等基础操作，到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互，几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估，我们引入了一个新颖且全面的数据集，专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集，包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象，以实现强大的检测和分类。

github 收录

UAV-VisLoc - 用于无人机视觉定位的大规模数据集

UAV-VisLoc数据集由北京邮电大学、中科院和香港城市大学联合构建，旨在解决无人机在失去全球导航卫星系统信号时的精确定位问题。该数据集涵盖了中国11个不同地点的无人机图像，捕获了多样化的地形特征，包括固定翼无人机和多地形无人机在不同高度和方向上拍摄的6742张图像以及11幅卫星地图。每张图像均附有经纬度、高度、拍摄日期和航向角等元数据，为模型的训练与测试提供了丰富多元的数据支持。UAV-VisLoc数据集用于支持无人机视觉定位任务，为无人机视觉定位任务提供了训练和测试样本，通过匹配无人机拍摄的地面向下视角图像与正射卫星地图，实现无人机的自主视觉定位。

github 收录