five

L3DAS21

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/L3DAS21
下载链接
链接失效反馈
官方服务:
资源简介:
L3DAS21 是一个用于 3D 音频信号处理的数据集。它由一个 65 小时的 3D 音频语料库组成,并附带一个 Python API,便于数据使用和结果提交阶段。 LEDAS21 数据集包含多源和多视角的 B 格式 Ambisonics 音频录音。作者对一间大型办公室的声场进行了采样,将两个一阶 Ambisonics 麦克风放置在房间中央,并移动扬声器在 252 个固定空间位置再现分析信号。依靠收集到的 Ambisonics 脉冲响应 (IR),作者增强了现有的干净单声道数据集,通过将原始声音与我们的 IR 进行卷积来获得合成的三维声源。 数据集分为两个主要部分,分别专用于挑战任务。 第一部分针对 3D 语音增强进行了优化,包含 30000 多个虚拟 3D 音频环境,持续时间长达 10 秒。在每个样本中,说话的声音总是与其他类似办公室的背景噪音一起出现。作为本节的目标数据,作者提供了干净的单声道语音信号。 相反,其他部分专门用于 3D 声音事件定位和检测任务,包含 900 个 60 秒长的音频文件。每个数据点都包含一个模拟的 3D 办公室音频环境,其中最多可以同时激活 3 个同时发生的声学事件。在本节中,样本不会强制包含口语。作为本节的目标数据,作者提供了数据点中存在的每个单独声音事件的起始和偏移时间戳、类型和空间坐标的列表。
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作