five

SONYC Urban Sound Tagging (SONYC-UST)|城市声音分类数据集|音频标记数据集

收藏
zenodo.org2024-10-25 收录
城市声音分类
音频标记
下载链接:
https://zenodo.org/record/3693077
下载链接
链接失效反馈
资源简介:
SONYC-UST数据集是一个用于城市声音分类和标记的多标签音频数据集。它包含了来自纽约市不同地点的音频记录,涵盖了多种城市环境中的声音,如交通、施工、人类活动等。数据集提供了详细的音频标签,包括声音类别、声源位置和环境背景信息。
提供机构:
zenodo.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
SONYC Urban Sound Tagging (SONYC-UST) 数据集的构建基于对城市环境中多种声源的细致采集与标注。该数据集通过部署在纽约市多个地点的麦克风网络,捕捉了长时间的城市声音片段。这些声音片段随后经过专业音频工程师的标注,涵盖了从交通噪音到人类活动的多种声学事件。数据集的构建过程中,采用了多层次的标注策略,包括基本类别和细粒度子类别,以确保标注的准确性和丰富性。
特点
SONYC-UST 数据集的显著特点在于其多层次的标注结构和广泛的应用场景。数据集不仅包含了常见的城市噪音类别,还细分了多种子类别,如特定类型的车辆声音和不同的人类活动声音。这种细致的分类使得该数据集在声学事件检测和分类任务中具有极高的实用价值。此外,数据集的时间跨度和地理位置多样性,为研究城市声景的时空变化提供了丰富的数据支持。
使用方法
SONYC-UST 数据集适用于多种声学研究和应用场景,包括但不限于城市噪音监测、声学事件检测和分类、以及环境声学分析。研究者可以通过该数据集训练和验证声学模型,以提高对复杂城市声景的理解和预测能力。使用该数据集时,建议结合多层次的标注信息,进行深度学习和机器学习模型的训练,以充分利用其丰富的标注细节和广泛的数据覆盖。
背景与挑战
背景概述
SONYC Urban Sound Tagging (SONYC-UST) 数据集是由纽约大学和索尼公司合作创建的,旨在推动城市环境声音分类与标记的研究。该数据集于2019年发布,主要研究人员包括T. D. Nguyen和B. McFee等,他们致力于解决城市环境中复杂声音事件的自动识别问题。SONYC-UST包含了来自纽约市多个地点的音频记录,涵盖了多种城市声音,如交通噪音、施工声音和人声等。这一数据集的发布极大地推动了环境声学和机器学习交叉领域的研究,为城市噪音管理和环境监测提供了重要的数据支持。
当前挑战
SONYC-UST数据集在构建和应用过程中面临多项挑战。首先,城市环境声音的多样性和复杂性使得数据标注和分类变得极为困难。其次,数据集的构建过程中需要处理大量的音频数据,确保数据的质量和一致性是一个巨大的技术挑战。此外,如何有效地利用这些数据进行模型训练,以提高声音识别的准确性和鲁棒性,也是当前研究的重点。最后,数据集的应用还需考虑隐私保护和数据安全问题,确保在推动技术进步的同时,不损害公众利益。
发展历史
创建时间与更新
SONYC Urban Sound Tagging (SONYC-UST)数据集由纽约大学于2019年创建,旨在为城市声音分类提供一个多标签、多层次的基准。该数据集自创建以来,经历了多次更新,以确保其数据质量和多样性。
重要里程碑
SONYC-UST数据集的一个重要里程碑是其在2020年发布的第二版本,该版本引入了更多的音频样本和更精细的标签层次结构,显著提升了数据集的实用性和研究价值。此外,该数据集在2021年成功应用于多个国际音频分类竞赛,进一步验证了其在城市声音分析领域的领先地位。
当前发展情况
当前,SONYC-UST数据集已成为城市声音分析和环境监测领域的重要资源。其多标签和多层次的特性,使得研究人员能够更精确地识别和分类城市中的各种声音,从而为城市规划和环境管理提供科学依据。此外,该数据集的不断更新和扩展,也推动了相关算法和模型的持续优化,为未来的智能城市建设和环境监测技术发展奠定了坚实基础。
发展历程
  • SONYC Urban Sound Tagging (SONYC-UST) 数据集首次发表,由纽约大学和索尼公司合作开发,旨在为城市环境中的声音分类和标注提供一个标准化的数据集。
    2019年
  • SONYC-UST 数据集首次应用于多个研究项目,包括声音分类算法评估和城市噪声监测系统的设计。
    2020年
  • SONYC-UST 数据集被广泛用于国际会议和期刊的论文中,成为城市声音分析领域的重要基准数据集。
    2021年
  • SONYC-UST 数据集的扩展版本发布,增加了更多的音频样本和详细的标注信息,进一步提升了其在研究中的应用价值。
    2022年
常用场景
经典使用场景
在城市声景研究领域,SONYC Urban Sound Tagging (SONYC-UST) 数据集被广泛用于多标签声音分类任务。该数据集包含了纽约市不同地点的音频片段,涵盖了多种城市环境中的声音事件,如交通噪音、施工声、人声等。通过分析这些音频数据,研究者能够开发和验证用于城市环境声音监测和分类的算法,从而为城市噪声管理和居民生活质量评估提供科学依据。
解决学术问题
SONYC-UST 数据集解决了城市声景研究中多标签分类的挑战,特别是在复杂城市环境中识别和分类多种声音事件的问题。这一数据集为学术界提供了一个标准化的基准,促进了多标签分类算法的发展和评估。通过使用该数据集,研究者能够更好地理解和模拟城市噪声的复杂性,从而推动相关领域的技术进步和理论创新。
衍生相关工作
基于 SONYC-UST 数据集,研究者们开发了多种声音分类和识别算法,如深度学习模型和传统的机器学习方法。这些算法在多个国际竞赛和学术会议上取得了显著成果,推动了城市声景分析技术的发展。此外,该数据集还激发了相关领域的研究,如声音事件的时间序列分析和多模态数据融合,进一步扩展了其在城市环境监测中的应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

UAVDT Dataset

The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.

datasetninja.com 收录

Photovoltaic power plant data

包括经纬度、电源板模型、NWP等信息。

github 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录