EPIC-SOUNDS
收藏arXiv2025-09-30 收录
下载链接:
https://epic-kitchens.github.io/epic-sounds/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个大规模的音频标注集,涵盖了第一人称视角视频中音频流内的时间范围和类别标签。它包含了78,366个被归类为44个不同类别的可听事件片段。该数据集不仅包括已分类的片段,还包含了未分类的片段,特别注重区分仅基于音频的标签,并评估基于音频的识别模型。作为一个大型数据集,它拥有78,366个片段,旨在支持音频识别和基于声音的动作检测任务。
提供机构:
EPIC-KITCHENS



