five

Ref-AVS 音频-视觉场景分割数据集

收藏
超神经2024-08-30 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/33701
下载链接
链接失效反馈
官方服务:
资源简介:
Ref-AVS 数据集由来自中国人民大学、北京邮电大学和上海人工智能实验室的研究人员于 2024 年发布的,相关论文成果为「Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes」,已被 ECCV2024 接受。

The Ref-AVS dataset was released in 2024 by researchers from Renmin University of China, Beijing University of Posts and Telecommunications, and Shanghai AI Laboratory. Its associated paper titled "Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes" has been accepted by ECCV 2024.
创建时间:
2024-08-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Ref-AVS是一个音频-视觉场景分割数据集,于2024年发布,相关论文被ECCV2024接受。它包含16.28 GB的数据,提供48个类别的像素级注释,用于多模态机器学习中的对象分割任务,视频来源于YouTube并统一修剪为10秒长度。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务