IDMT-Traffic
收藏arXiv2021-04-28 更新2024-06-21 收录
下载链接:
https://www.idmt.fraunhofer.de/en/publications/datasets.html
下载链接
链接失效反馈官方服务:
资源简介:
IDMT-Traffic数据集是由德国弗劳恩霍夫应用研究促进协会创建的,旨在支持城市和长途道路上的车辆检测与分类研究。该数据集包含约2.5小时的立体声录音,记录了4718次车辆通过事件,使用高质量的sE8麦克风和中等质量的MEMS麦克风。录音涵盖了不同的速度限制和道路条件,如湿滑和干燥路面。数据集的创建过程包括在四个不同的地点进行同步录音,并通过视频辅助进行车辆类型和移动方向的标注。IDMT-Traffic数据集适用于评估音频分类算法在受限麦克风质量和硬件处理能力下的应用,特别是在智能交通系统中,用于优化交通流量和减少污染。
The IDMT-Traffic dataset was developed by the Fraunhofer Society in Germany, a leading applied research association, to support research on vehicle detection and classification on urban and long-distance roads. This dataset contains approximately 2.5 hours of stereo audio recordings, capturing a total of 4718 vehicle passing events, which were collected using high-quality sE8 microphones and medium-quality MEMS microphones. The recordings cover diverse speed limits and various road conditions, including wet and dry road surfaces. The dataset construction process involved synchronized audio recordings conducted at four distinct locations, with annotations for vehicle types and movement directions assisted by video footage. The IDMT-Traffic dataset is well-suited for evaluating the performance of audio classification algorithms under constraints of microphone quality and hardware processing capacity, particularly for applications in intelligent transportation systems (ITS) aimed at optimizing traffic flow and reducing pollution.
提供机构:
弗劳恩霍夫应用研究促进协会
创建时间:
2021-04-28
搜集汇总
数据集介绍

构建方式
在智能交通系统日益成为缓解城市交通压力关键技术的背景下,IDMT-Traffic数据集通过精心设计的实地采集方案构建而成。研究团队在德国伊尔梅瑙及其周边选择了四个具有代表性的交通场景,包括城市道路与乡村公路,覆盖了30、50及70公里/小时的不同限速路段以及干湿路面条件。数据采集采用双麦克风阵列配置,同步部署了高品质sE8麦克风与中品质MEMS麦克风,两者间距固定为18.5厘米,并安置于距道路边缘0.5米处。同时,为保障隐私,仅拍摄车辆下半部分的视频用于标注车辆类型与行驶方向。最终,数据集收录了总计2.5小时的双声道音频,包含4718次经过车辆的精确标注事件,形成了涵盖轿车、卡车、公交车及摩托车四类车辆的声学样本库。
特点
该数据集的核心特点在于其面向实际部署的基准测试设计。它不仅提供了高保真度的声学记录,还特意包含了来自低成本MEMS麦克风的音频,从而模拟了嵌入式传感设备在有限硬件资源下的真实工作环境。数据集中车辆类型的分布呈现自然不平衡状态,如轿车样本占据主导,这反映了真实交通流量的固有特点,有助于评估算法在非均衡数据上的鲁棒性。此外,数据集涵盖了多样化的道路条件与车速场景,为研究车辆声音特征随速度与环境的变化规律提供了丰富素材。其多模态同步记录(音频与视频)确保了标注的高可靠性,为声学交通监测算法的开发与验证奠定了坚实基础。
使用方法
该数据集主要服务于声学交通监测算法的训练与评估。研究人员可首先对立体声音频进行预处理,例如将双声道平均为单声道,或提取梅尔频谱图与通道间互相关函数作为特征表示。针对车辆类型分类任务,可以围绕标注的车辆经过时刻截取音频片段,并引入无车辆通过的背景音频片段作为负样本,构建四分类(轿车、卡车、摩托车、无车辆)数据集。对于行驶方向估计,则可利用互相关特征来捕捉声音源移动的轨迹特征。数据集已预设了基于不同录制地点(对应不同车速)的训练、验证与测试划分,便于进行跨场景的泛化能力测试。在模型方面,研究已证明诸如VGGNet、ResNet等卷积神经网络在此数据上能取得优异性能,同时轻量级的MobileNet架构也适用于资源受限的嵌入式部署场景。
背景与挑战
背景概述
随着全球城市化进程加速,交通拥堵与噪声污染问题日益凸显,智能交通系统成为优化交通流、提升城市管理效能的关键技术。在这一背景下,弗劳恩霍夫数字媒体技术研究所(Fraunhofer IDMT)的研究团队于2021年推出了IDMT-Traffic数据集,旨在为声学交通监测研究提供开放基准。该数据集聚焦于利用音频信号实现车辆类型分类与运动方向估计,核心研究问题在于探索低成本、非侵入式的交通监控方案,以弥补传统视觉或雷达传感器在部署成本与维护复杂度上的不足。通过收录2.5小时的双声道音频记录及4718个标注车辆通过事件,IDMT-Traffic不仅推动了声学感知算法在嵌入式设备上的应用验证,也为城市交通规划与噪声治理研究提供了重要数据支撑。
当前挑战
在声学交通监测领域,IDMT-Traffic数据集致力于解决车辆类型精确分类与运动方向实时估计的难题,其核心挑战在于区分声学特征相似的车辆(如卡车与轿车),以及在不同环境噪声与车速条件下保持算法鲁棒性。数据构建过程中,研究团队面临多重困难:一是需在保护隐私的前提下同步采集高质量音频与视频数据,确保标注准确性;二是需平衡自然交通场景中车辆类别的分布不均,如公交车样本稀缺;三是需兼容不同麦克风品质(如专业sE8与低成本MEMS),以模拟真实嵌入式传感器的性能限制,这为算法泛化与域适应研究提出了更高要求。
常用场景
经典使用场景
在智能交通系统领域,IDMT-Traffic数据集为声学交通监测研究提供了标准化的评估基准。该数据集通过高精度标注的车辆通行音频,支持研究者开发与优化基于深度学习的车辆类型分类与运动方向估计模型。其多麦克风配置与多样化道路场景设计,使得算法能够在不同声学环境下验证鲁棒性,成为声学感知技术在交通流量分析中的核心实验平台。
解决学术问题
IDMT-Traffic数据集有效应对了声学交通监测中数据稀缺与标注标准不统一的学术挑战。通过提供大规模、多场景的立体声音频及详细事件标注,该数据集助力解决车辆声学特征提取、噪声环境下事件检测以及跨设备模型泛化等关键问题。其公开性促进了算法比较与复现,推动了声学感知与智能交通交叉领域的标准化研究进程。
衍生相关工作
围绕IDMT-Traffic数据集,学术界衍生出一系列聚焦声学交通监测的经典研究工作。这些研究涵盖轻量化神经网络架构设计、跨麦克风类型的域适应方法、以及多任务学习框架,例如结合梅尔频谱与互相关特征的运动轨迹分析。部分工作进一步扩展至车辆速度估计与重型车辆细分分类,持续推动声学感知技术在复杂交通场景中的实用化进展。
以上内容由遇见数据集搜集并总结生成



