Ref-AVS 音频-视觉场景分割数据集

超神经2024-08-30 更新2024-12-14 收录

下载链接：

https://hyper.ai/cn/datasets/33701

下载链接

链接失效反馈

官方服务：

资源简介：

Ref-AVS 数据集由来自中国人民大学、北京邮电大学和上海人工智能实验室的研究人员于 2024 年发布的，相关论文成果为「Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes」，已被 ECCV2024 接受。

The Ref-AVS dataset was released in 2024 by researchers from Renmin University of China, Beijing University of Posts and Telecommunications, and Shanghai AI Laboratory. Its associated paper titled "Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes" has been accepted by ECCV 2024.

创建时间：

2024-08-23

搜集汇总

数据集介绍

背景与挑战

背景概述

Ref-AVS是一个音频-视觉场景分割数据集，于2024年发布，相关论文被ECCV2024接受。它包含16.28 GB的数据，提供48个类别的像素级注释，用于多模态机器学习中的对象分割任务，视频来源于YouTube并统一修剪为10秒长度。

以上内容由遇见数据集搜集并总结生成