five

GTOT, RGBT210, RGBT234, VOT-RGBT19, VOT-RGBT20, LasHeR, VTUAV, LSS-Dataset(from RGB), LSS-Dataset(from TIR)|视频跟踪数据集|图像识别数据集

收藏
github2024-05-19 更新2024-05-31 收录
视频跟踪
图像识别
下载链接:
https://github.com/Zhangyong-Tang/RGBT-Tracking-Results-Datasets-and-Methods
下载链接
链接失效反馈
资源简介:
GTOT: 50对视频,约1.5万帧。RGBT210: 210对视频。RGBT234: 234对视频,RGBT210的扩展。VOT-RGBT19: 60对视频,约2万帧对,RGBT234的子集。VOT-RGBT20: 60对视频,数据与VOT-RGBT19相同,但评估机制不同。LasHeR: 训练/测试分割,抬头显示视角拍摄,总计超过70万对图像;测试集包含245个视频。VTUAV: 通过无人机从顶部向下拍摄,长期跟踪;测试集包含176个视频,平均约3500帧。LSS-Dataset(from RGB): 从VID生成。LSS-Dataset(from TIR): 从TIR生成。

GTOT:包含50对视频,共计约1.5万帧。RGBT210:包含210对视频。RGBT234:包含234对视频,为RGBT210的扩展。VOT-RGBT19:包含60对视频,约2万帧,为RGBT234的子集。VOT-RGBT20:包含60对视频,数据与VOT-RGBT19一致,但评估机制有所区别。LasHeR:数据集分为训练/测试两部分,采用抬头显示视角拍摄,总计超过70万对图像;测试集包含245个视频。VTUAV:通过无人机从上方俯瞰进行长期跟踪拍摄;测试集包含176个视频,平均每段视频约3500帧。LSS-Dataset(由RGB生成):源自VID数据集。LSS-Dataset(由TIR生成):源自TIR数据集。
创建时间:
2023-07-02
原始信息汇总

数据集概述

数据集列表

数据集 发布年份 链接 简介
OTCBVS CVIU2007 OTCBVS 9个视频
LITIV CVIU2012 LITIV 6个视频
GTOT TIP2016 GTOT 50对视频,约1.5万帧
RGBT210 ACM MM2017 RGBT210 210对视频
RGBT234 PR2018 RGBT234 234对视频,RGBT210的扩展
VOT-RGBT19 VOT社区:2019 VOT-RGBT2019 60对视频,约2万帧对,RGBT 234的子集
VOT-RGBT20 VOT社区:2020 VOT-RGBT2020 60对视频,数据与VOT-RGBT2019相同,但评估机制不同
LasHeR TIP2021 LasHeR 训练/测试分割,共超过70万对图像,测试集245个视频
VTUAV CVPR2022 VTUAV 通过无人机从顶部拍摄,长期跟踪;测试集176个视频,平均约3300帧
MV-RGBT Arxiv2024 MV-RGBT 122对视频,主要关注模态有效性

生成数据

数据集 发布年份 链接 简介
LSS-Dataset(from RGB) TCSVT2021 LSS-Dataset 从VID生成
LSS-Dataset(from TIR) TCSVT2021 LSS-Dataset 从TIR生成

方法与结果

方法概览

  • XTrack
  • SeqTrackv2
  • KSTrack
  • MINet
  • BAT
  • TATrack
  • GMMT
  • LMINet
  • CAT++
  • AMNet
  • MPLKD
  • QueryTrack
  • MCTrack
  • SDSTrack
  • OneTracker
  • UnTrack
  • UStrack
  • AFter
  • CSTNet
  • CAFF
  • SAFT
  • IPL
  • MPT
  • MIGTD
  • Proformer
  • AWCM
  • FDAFT
  • DFAT
  • ViPT
  • CMD
  • TBSI
  • BD2Track
  • SiamTDR
  • SiamAFTS
  • UMT
  • MPDMT
  • RSFNet
  • QAT
  • PRO
  • DFNet
  • DTAN
  • DECFNet
  • DMSTM
  • SiamFEA
  • HATFNet
  • MACFT
  • LCMIT
  • MMMPT
  • MPDMT
  • FSBNet
  • MTNet
  • SiamMFF
  • LSAR
  • CSMMA
  • MPLT
  • CRSP
  • GABBP
  • PLASSO-ADSPF
  • SRCDCF
  • MFENet
  • RMFNet
  • M2GCI
  • SiamIVFN
  • STRT
  • SGF_MDNet+RGBT

结果分析

结果分析表格中包含了多个方法在不同数据集上的性能表现,包括精度(PR)、成功率(SR)等指标。具体数值请参考原始数据集详情页面中的表格。

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建主要基于多模态视觉对象跟踪的需求,通过收集和整理来自不同来源的视频数据,形成了一系列具有RGB和热成像(TIR)双模态的视频对。这些数据集包括GTOT、RGBT210、RGBT234等,每个数据集都经过精心筛选和标注,以确保数据的质量和多样性。例如,GTOT数据集包含了50对视频,约1.5万帧,而RGBT210则包含了210对视频。这些数据集的构建旨在为研究者提供一个全面且高质量的多模态跟踪数据资源。
特点
这些数据集的主要特点在于其多模态的特性,即同时包含可见光(RGB)和热成像(TIR)两种模态的数据。这种双模态的结合不仅丰富了数据的维度,还为研究者提供了在不同光照和环境条件下进行跟踪算法测试的机会。此外,数据集的多样性也是其显著特点之一,涵盖了从简单的日常场景到复杂的无人机视角等多种场景,确保了跟踪算法的广泛适用性。
使用方法
使用这些数据集时,研究者可以将其用于训练和验证多模态视觉对象跟踪算法。首先,可以通过下载相应的数据集文件并解压缩,然后根据需要选择合适的视频对进行分析。在训练过程中,可以将RGB和TIR模态的数据分别输入到算法中,利用双模态信息进行特征融合和目标跟踪。在验证阶段,可以通过对比算法在不同数据集上的表现,评估其在多模态环境下的鲁棒性和准确性。
背景与挑战
背景概述
RGBT-Tracking-Results-Datasets-and-Methods数据集系列,始于2023年2月7日,由Zhangyong Tang等研究人员发起,旨在深入探讨多模态视觉对象跟踪(RGBT Tracking)领域。该数据集系列涵盖了多个子数据集,如GTOT、RGBT210、RGBT234等,每个数据集均包含大量视频对及其对应的帧数据,旨在为研究人员提供丰富的多模态视觉对象跟踪数据资源。这些数据集的创建不仅推动了多模态跟踪技术的发展,还为相关领域的研究提供了坚实的基础。
当前挑战
RGBT-Tracking-Results-Datasets-and-Methods数据集系列在构建过程中面临诸多挑战。首先,多模态数据的融合与同步是一个复杂的问题,如何在不同模态间实现精确的时间和空间对齐,是确保跟踪算法性能的关键。其次,数据集的多样性和复杂性要求算法具备强大的鲁棒性和适应性,以应对各种环境条件和对象变化。此外,数据集的规模和质量也是一大挑战,如何在保证数据多样性的同时,确保数据的准确性和一致性,是数据集构建过程中需要解决的重要问题。
常用场景
经典使用场景
在多模态视觉对象跟踪领域,GTOT、RGBT210、RGBT234等数据集的经典使用场景主要集中在算法性能评估和模型训练上。这些数据集通过提供丰富的RGB和热红外图像对,使得研究人员能够开发和验证融合多模态信息的跟踪算法。例如,通过在GTOT数据集上训练模型,可以显著提升算法在复杂环境下的鲁棒性和准确性,这对于自动驾驶、安防监控等实际应用具有重要意义。
实际应用
在实际应用中,这些数据集支持的算法广泛应用于自动驾驶、安防监控、无人机导航等领域。例如,在自动驾驶系统中,结合RGB和热红外图像的跟踪算法可以提高车辆在夜间或恶劣天气条件下的感知能力,从而提升行车安全。在安防监控中,多模态跟踪技术能够更准确地识别和跟踪可疑目标,增强监控系统的效能。
衍生相关工作
基于这些数据集,研究者们开发了多种多模态跟踪算法,如DuSiamIE、TMTB、FFEUMA等,这些算法在多个公开数据集上取得了优异的性能。此外,这些数据集还催生了多篇综述性论文,如《Multi-modal visual tracking: Review and experimental comparison》和《RGBT tracking: A comprehensive review》,这些论文系统总结了多模态跟踪领域的研究进展,为后续研究提供了宝贵的参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

LFW (Labeled Faces in the Wild)

Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。

OpenDataLab 收录

CMACD

这是一个基于社交媒体用户的多标签中文情感计算数据集,整合了用户的性格特质与六种情感及微情感,每种情感都标注了强度级别。数据集旨在推进机器对复杂人类情感的识别,并为心理学、教育、市场营销、金融和政治等领域的研究提供数据支持。

github 收录