ToyADMOS
收藏github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/YumaKoizumi/ToyADMOS-dataset
下载链接
链接失效反馈官方服务:
资源简介:
ToyADMOS数据集是一个大约540小时的正常机器操作声音和超过12,000个异常声音样本的集合,由Yuma Koizumi和NTT媒体智能实验室的成员准备。该数据集设计用于机器操作声音的异常检测(ADMOS)研究,通过故意损坏迷你机器的组件来收集正常和异常操作声音。它适用于ADMOS的三个任务:产品检验(玩具车)、固定机器的故障诊断(玩具输送带)和移动机器的故障诊断(玩具火车)。
The ToyADMOS dataset is a collection of approximately 540 hours of normal machine operation sounds and over 12,000 abnormal sound samples, prepared by Yuma Koizumi and members of the NTT Media Intelligence Laboratories. This dataset is designed for research on Anomaly Detection in Machine Operating Sounds (ADMOS), where normal and abnormal operation sounds are collected by deliberately damaging components of miniature machines. It is suitable for three tasks in ADMOS: product inspection (toy cars), fault diagnosis of stationary machines (toy conveyor belts), and fault diagnosis of mobile machines (toy trains).
创建时间:
2019-07-25
原始信息汇总
ToyADMOS 数据集概述
数据集描述
- 名称: ToyADMOS 数据集
- 类型: 机器操作声音数据集
- 时长: 约540小时正常机器操作声音和超过12,000个异常声音样本
- 采样率: 48kHz
- 麦克风数量: 4个
- 目的: 用于异常声音检测(ADMOS)研究,特别是针对玩具机器的异常检测
- 任务: 产品检查(玩具车)、固定机器故障诊断(玩具输送带)、移动机器故障诊断(玩具火车)
数据集组成
- 数据量: 总数据量超过440GB
- 压缩格式: 使用7-zip分割成7-9个文件,总压缩后大小约180GB,每个子数据集约60GB
数据集使用
- 下载: 可通过Zenodo下载
- 使用示例: 提供Python代码用于数据生成、训练和测试
- 包含创建小型数据集、模型训练和测试的Python脚本
- 环境要求: Python 3.6.8, Chainer 4.5.0, NumPy 1.16.2, CuPy 4.1.0等
引用信息
- 参考文献: Yuma Koizumi, Shoichiro Saito, Noboru Harada, Hisashi Uematsu and Keisuke Imoto, "ToyADMOS: A Dataset of Miniature-Machine Operating Sounds for Anomalous Sound Detection," in Proc of Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2019.
- 论文链接: arXiv:1908.03299
联系方式
- 作者: Yuma Koizumi, Shoichiro Saito, Noboru Harada, Hisashi Uematsu, Keisuke Imoto
- 联系邮箱: koizumi.yuma@ieee.org
搜集汇总
数据集介绍

构建方式
ToyADMOS数据集由NTT Media Intelligence Laboratories的Yuma Koizumi及其团队精心构建,旨在为机器操作声音的异常检测(ADMOS)研究提供丰富的数据资源。该数据集包含约540小时的正常机器操作声音和超过12,000个异常声音样本,这些样本通过四麦克风以48kHz的采样率采集。研究团队通过故意损坏微型机器的组件,收集了这些正常和异常的操作声音,以支持产品检测(玩具车)、固定机器故障诊断(玩具传送带)和移动机器故障诊断(玩具火车)三项ADMOS任务。
特点
ToyADMOS数据集的显著特点在于其大规模和多样性。数据集不仅涵盖了长时间的正常操作声音,还包含了大量精心设计的异常声音样本,这些样本能够有效模拟实际工业环境中可能出现的故障情况。此外,数据集的采集过程严格遵循高采样率标准,确保了声音信号的高保真度,从而为研究人员提供了高质量的实验数据。
使用方法
使用ToyADMOS数据集时,用户首先需从Zenodo平台下载数据集,该数据集被分割为多个7z格式的压缩文件,总大小约为180GB。下载后,用户可使用任意压缩工具解压这些文件。为方便用户,数据集提供了Python代码示例,包括数据生成、模型训练和测试等步骤。用户需根据自身环境调整代码中的路径设置,并按照提供的教程进行操作,以实现对数据集的有效利用。
背景与挑战
背景概述
ToyADMOS数据集是由NTT Media Intelligence Laboratories的Yuma Koizumi及其团队创建,旨在为机器操作声音的异常检测(ADMOS)研究提供支持。该数据集包含约540小时的正常机器操作声音和超过12,000个异常声音样本,通过四麦克风以48kHz采样率采集。ToyADMOS数据集特别针对三种ADMOS任务设计:产品检测(玩具车)、固定机器的故障诊断(玩具传送带)和移动机器的故障诊断(玩具火车)。该数据集的创建为机器声音异常检测领域提供了宝贵的资源,推动了相关技术的研究与应用。
当前挑战
ToyADMOS数据集在构建过程中面临多项挑战。首先,数据集的规模庞大,总容量超过440GB,压缩后仍需约180GB的存储空间,这给数据存储和传输带来了显著的技术难题。其次,数据集的多样性和复杂性要求研究人员在处理和分析时具备高度的专业知识,以确保数据的准确性和有效性。此外,数据集的异常声音样本是通过故意损坏机器组件收集的,这要求在实验设计和数据采集过程中保持高度的控制和一致性。这些挑战不仅影响了数据集的构建,也对后续的研究和应用提出了更高的要求。
常用场景
经典使用场景
在机器操作声音异常检测(ADMOS)研究领域,ToyADMOS数据集因其丰富的正常和异常操作声音样本而成为经典。该数据集特别适用于三个主要任务:玩具车的产品检测、固定玩具传送带的故障诊断以及移动玩具火车的故障诊断。通过这些任务,研究人员可以开发和验证用于检测机器异常声音的算法,从而提高工业自动化和质量控制的水平。
解决学术问题
ToyADMOS数据集解决了机器操作声音异常检测中的关键学术问题,包括如何有效区分正常和异常声音、如何提高检测算法的鲁棒性以及如何在复杂噪声环境中进行精确诊断。该数据集的引入为学术界提供了一个标准化的测试平台,促进了相关算法的开发和评估,对推动异常检测技术的发展具有重要意义。
衍生相关工作
基于ToyADMOS数据集,许多相关研究工作得以展开。例如,有研究者利用该数据集开发了基于深度学习的异常声音检测模型,显著提高了检测精度。此外,还有研究探讨了如何在多源声音数据中进行联合分析,以提高故障诊断的准确性。这些衍生工作不仅丰富了ADMOS领域的研究内容,也为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



