Nexdata/Mandarin_Speech_Data_in_Noisy_Environment_by_Mobile_Phone|自动语音识别数据集|机器翻译数据集
收藏数据集概述
数据集名称
- 名称: Nexdata/Mandarin_Speech_Data_in_Noisy_Environment_by_Mobile_Phone
数据集描述
- 摘要: 该数据集包含在嘈杂环境中通过手机录制的普通话语音数据,由来自中国各地的203名说话者录制,覆盖所有主要方言区域,并包含地铁、超市、餐厅等多种噪声场景,更适合实际应用场景。适用于自动语音识别、机器翻译和声纹识别。
- 支持的任务: 自动语音识别(ASR)、音频说话人识别、嘈杂语音识别。
- 语言: 中文普通话
数据集结构
- 数据实例: [信息待补充]
- 数据字段: [信息待补充]
- 数据分割: [信息待补充]
数据集创建
- 采集理由: [信息待补充]
- 源数据: [信息待补充]
- 注释: [信息待补充]
- 个人和敏感信息: [信息待补充]
使用数据注意事项
- 社会影响: [信息待补充]
- 偏见讨论: [信息待补充]
- 其他已知限制: [信息待补充]
附加信息
- 数据集维护者: [信息待补充]
- 许可信息: 商业许可,详情见链接:商业许可
- 引用信息: [信息待补充]
- 贡献: [信息待补充]
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
LUNA16
LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。
OpenDataLab 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录