MUSAN Corpus|语音识别数据集|音频处理数据集
收藏
- MUSAN Corpus首次发表,由David Snyder等人创建,旨在提供一个用于音频处理任务的标准化噪声和语音数据集。
- MUSAN Corpus首次应用于语音识别和说话人识别研究,展示了其在增强模型鲁棒性方面的潜力。
- MUSAN Corpus被广泛应用于多个国际会议和期刊的论文中,进一步验证了其在音频处理领域的实用性和有效性。
- MUSAN Corpus的扩展版本发布,增加了更多的噪声和语音样本,以满足日益增长的音频处理需求。
中指数据库(物业版)
物业版解决物业企业“找项目”、“找行业和企业数据"的迫切需求,提供高效的市场拓展渠道、最新行业动态、竞品企业的多维度数据,助力企业科学决策。
西部数据交易中心 收录
密云区2022年常住人口情况
该数据是密云区提供的密云区2022年常住人口情况信息,包括1个文本。
北京市公共数据开放平台 收录
SARDet-100K
SARDet-100K数据集是由南开大学计算机科学与技术学院的研究团队开发的,旨在解决SAR目标检测领域数据集有限和代码不可访问的问题。该数据集通过整合和标准化10个公开的SAR检测数据集,提供了约116,598张图像和245,653个目标实例,覆盖了飞机、船只、汽车、桥梁、坦克和港口等6个类别。SARDet-100K不仅是首个COCO级别的大规模多类别SAR目标检测数据集,而且通过其大规模和多样性,为SAR目标检测算法的研究和评估提供了强有力的支持。数据集的标准化处理确保了图像分辨率和标注格式的统一,便于与流行的开源检测代码框架兼容,极大地促进了SAR目标检测技术的发展和创新。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
轴承故障数据集
本项目集成了多个公开的轴承故障数据集,所有数据均被处理为1秒/个的数据样本,并使用fft得到其频域特征。支持通过数据集、通道、故障、严重程度对所有样本进行筛选,并选择时域或频域显示。
github 收录