DAVIS (Densely Annotated VIdeo Segmentation)|视频分割数据集|计算机视觉数据集

Papers with Code2024-05-15 收录

视频分割

计算机视觉

下载链接：

https://paperswithcode.com/dataset/davis

下载链接

链接失效反馈

资源简介：

The Densely Annotation Video Segmentation dataset (DAVIS) is a high quality and high resolution densely annotated video segmentation dataset under two resolutions, 480p and 1080p. There are 50 video sequences with 3455 densely annotated frames in pixel level. 30 videos with 2079 frames are for training and 20 videos with 1376 frames are for validation.

AI搜集汇总

数据集介绍

构建方式

DAVIS数据集的构建基于对视频序列的密集标注，涵盖了多种动态场景。研究团队精心挑选了具有挑战性的视频片段，确保涵盖不同光照条件、物体运动速度及复杂背景。通过人工和半自动标注工具相结合的方式，对每一帧中的目标物体进行精确的分割标注，从而生成高质量的像素级标注数据。

特点

DAVIS数据集以其高质量的像素级标注和多样化的场景著称。该数据集不仅包含了静态背景下的物体分割，还涵盖了复杂运动场景中的目标追踪。此外，DAVIS数据集提供了多种分辨率的视频序列，以适应不同应用场景的需求。其标注的精细度和多样性使其成为视频分割和目标追踪领域的标准测试集。

使用方法

DAVIS数据集主要用于评估和改进视频分割和目标追踪算法。研究者可以通过该数据集进行模型的训练和测试，以验证其在不同场景下的性能。使用时，用户可以下载数据集并根据提供的标注文件进行算法开发和验证。此外，DAVIS数据集还支持多种编程语言和深度学习框架，便于研究者进行跨平台实验。

背景与挑战

背景概述

DAVIS（Densely Annotated VIdeo Segmentation）数据集于2016年由Jordi Pont-Tuset等研究人员在巴塞罗那自治大学创建，旨在推动视频分割领域的研究。该数据集包含了50个高质量的视频序列，每个序列均配有密集的像素级标注，涵盖了多种动态场景和对象类别。DAVIS数据集的推出，极大地促进了视频分割算法的发展，特别是在处理复杂运动和遮挡问题上，为研究人员提供了宝贵的实验平台。其核心研究问题是如何在视频中实现精确的对象分割，这对于视频编辑、增强现实和自动驾驶等领域具有重要意义。

当前挑战

尽管DAVIS数据集在视频分割领域取得了显著进展，但其构建和应用过程中仍面临诸多挑战。首先，密集的像素级标注需要大量的人力和时间，这限制了数据集的扩展和更新速度。其次，视频中的动态变化和遮挡问题使得分割任务异常复杂，现有的算法在处理这些情况时仍存在精度不足的问题。此外，数据集的多样性和代表性也是一个挑战，如何涵盖更多种类的动态场景和对象，以提高算法的泛化能力，是当前研究的重点。最后，随着深度学习技术的发展，如何有效地利用DAVIS数据集进行模型训练和评估，以推动视频分割技术的进一步发展，也是一个亟待解决的问题。

发展历史

创建时间与更新

DAVIS数据集于2016年首次发布，旨在为视频分割任务提供高质量的标注数据。该数据集在2017年进行了更新，增加了更多的视频序列和精细的标注，以进一步提升其在计算机视觉领域的应用价值。

重要里程碑

DAVIS数据集的发布标志着视频分割领域的一个重要里程碑。其首次引入的密集标注方法，使得研究人员能够更精确地评估和改进视频分割算法。2017年的更新不仅扩展了数据集的规模，还引入了新的挑战，如多目标分割和动态背景处理，进一步推动了该领域的发展。此外，DAVIS还举办了多次挑战赛，吸引了全球研究者的参与，促进了视频分割技术的快速进步。

当前发展情况

当前，DAVIS数据集已成为视频分割研究的标准基准之一，广泛应用于学术研究和工业应用中。其高质量的标注和多样化的视频内容，为研究人员提供了丰富的实验数据，推动了视频分割算法的不断创新和优化。随着深度学习技术的快速发展，DAVIS数据集的应用范围也在不断扩大，从简单的对象分割到复杂的场景理解，为计算机视觉领域的发展做出了重要贡献。

发展历程

DAVIS数据集首次发表，提供了密集标注的视频分割数据，旨在推动视频分割技术的发展。
2016年
DAVIS Challenge在CVPR（计算机视觉与模式识别会议）上首次举办，吸引了全球研究者的关注和参与。
2017年
DAVIS数据集更新至2017版本，增加了更多的视频样本和更精细的标注，进一步提升了数据集的质量和多样性。
2018年
DAVIS Challenge继续在CVPR上举办，成为视频分割领域的重要赛事，推动了相关技术的快速发展。
2019年
DAVIS数据集再次更新，引入了新的挑战和任务，如半监督和无监督视频分割，扩展了数据集的应用范围。
2020年

常用场景

经典使用场景

在计算机视觉领域，DAVIS数据集以其密集标注的视频分割任务而闻名。该数据集包含了高质量的像素级标注，涵盖了多种动态场景，如运动物体、遮挡和复杂背景。研究者们常利用DAVIS数据集来评估和改进视频分割算法，特别是那些需要处理时间序列中物体变化和遮挡的算法。通过对比不同算法在DAVIS上的表现，可以有效衡量其在真实世界视频中的适用性和鲁棒性。

解决学术问题

DAVIS数据集在解决视频分割领域的学术研究问题中发挥了关键作用。它为研究者提供了一个标准化的基准，用于评估和比较不同视频分割方法的性能。通过DAVIS数据集，研究者们能够深入探讨如何处理视频中的时间一致性、物体遮挡和复杂背景等问题。这不仅推动了视频分割技术的发展，还为其他相关领域如视频编辑、增强现实和自动驾驶提供了理论和实践基础。

衍生相关工作

DAVIS数据集的发布催生了大量相关的经典工作。许多研究者基于DAVIS数据集提出了新的视频分割算法，如基于深度学习的时序一致性模型和多目标跟踪方法。此外，DAVIS数据集还激发了关于视频分割评价指标的研究，推动了更加全面和客观的性能评估体系的建立。这些衍生工作不仅丰富了视频分割领域的理论基础，也为实际应用提供了强有力的技术支持。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

MedDialog

MedDialog数据集（中文）包含了医生和患者之间的对话（中文）。它有110万个对话和400万个话语。数据还在不断增长，会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国高分辨率高质量PM2.5数据集（2000-2023）

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集（ChinaHighAirPollutants, CHAP）中PM2.5数据集。该数据集利用人工智能技术，使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值，结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92，均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区，空间分辨率为1 km，时间分辨率为日、月、年，单位为µg/m3。注意：该数据集持续更新，如需要更多数据，请发邮件联系作者（weijing_rs@163.com; weijing@umd.edu）。数据文件中包含NC转GeoTiff的四种代码（Python、Matlab、IDL和R语言）nc2geotiff codes。

国家青藏高原科学数据中心收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录

SDM-Car

SDM-Car数据集由武汉大学和中国空间技术研究院联合开发，旨在解决卫星视频中低辐射强度下暗淡移动车辆的检测问题。该数据集包含99个高质量卫星视频，覆盖多种场景，如沙漠、城市、港口等，提供了1469948个精确标注的车辆实例。数据集通过珞珈3-01卫星的视频凝视成像模式收集，空间分辨率为0.75米，帧率为6/8 fps。数据集的创建过程包括手动标注和自动化工具辅助标注，最终生成了大量针对暗淡车辆的标注。该数据集的应用领域包括数字城市、智能交通和智能监控，旨在提升卫星视频中暗淡车辆的检测精度。

arXiv 收录