ahmedeveloper/valorant-object-detection-paligemma

Name: ahmedeveloper/valorant-object-detection-paligemma
Creator: ahmedeveloper
Published: 2026-04-30 11:25:58
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/ahmedeveloper/valorant-object-detection-paligemma

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含带有相关元数据的图像，包括图像尺寸、对象注释（如边界框和类别）以及标签。数据集分为训练集、验证集和测试集，每个部分都有特定的大小和示例数量。特征包括图像ID、图像、尺寸、对象详细信息（如ID、区域、边界框和类别）以及标签。类别被标记为特定的名称，如dropped spike、enemy、planted spike和teammate。还提供了数据集的总大小和下载大小。

This dataset contains images with associated metadata, including image dimensions, object annotations (such as bounding boxes and categories), and labels. The dataset is divided into training, validation, and test splits, with specific sizes and examples for each. The features include image IDs, images, dimensions, object details (like IDs, areas, bounding boxes, and categories), and labels. The categories are class-labeled with specific names like dropped spike, enemy, planted spike, and teammate. The datasets total size and download size are also provided.

提供机构：

ahmedeveloper

搜集汇总

数据集介绍

构建方式

该数据集专为《Valorant》游戏中的目标检测任务而设计，基于PaliGemma模型的需求进行构建。数据集中包含图像及其对应的边界框标注，覆盖了四种关键类别：掉落的炸弹（dropped spike）、已安装的炸弹（planted spike）、敌人（enemy）和队友（teammate）。所有图像均经过人工或半自动标注，确保边界框的精确性，并额外生成用于多模态理解的PaliGemma标签文本。数据被划分为训练集（6927个样本）、验证集（1983个样本）和测试集（988个样本），总样本量达9898个，以支持模型的训练、调优与评估。

特点

数据集的一大特色是融合了传统目标检测标注与多模态语言标签，每个实例不仅包含标准化的边界框坐标（bbox）和类别信息，还附带了描述图像内容的PaliGemma标签文本，这使其适用于视觉语言模型的微调。类别定义清晰，聚焦于游戏中的关键实体，有助于提升模型在电子竞技场景下的检测鲁棒性。此外，数据集提供了图像元数据（如宽度、高度），为预处理提供了便利。

使用方法

该数据集可通过HuggingFace的datasets库轻松加载，使用默认配置即可获取训练、验证和测试分片。用户可利用图像字段和objects序列中的边界框与类别标签，训练传统的目标检测模型，或者直接使用paligemma_labels字段对PaliGemma等视觉语言模型进行指令微调。数据以标准格式存储，支持高效的流式读取和批处理，便于集成到现有的深度学习工作流程中。

背景与挑战

背景概述

随着电子竞技产业的蓬勃发展和实时策略游戏的日益普及，计算机视觉技术在游戏领域的应用逐渐成为研究热点。其中，目标检测作为一项基础且关键的任务，在游戏场景理解、自动解说生成、玩家行为分析等方面展现出巨大潜力。为填补此领域专用数据集的空白，valorant-object-detection-paligemma数据集应运而生。该数据集由研究团队于近年创建，专注于《无畏契约》（Valorant）这一热门第一人称射击游戏，旨在为游戏内关键目标的检测提供标准化的训练与评估基准。其核心研究问题聚焦于如何精准识别游戏中的敌方、友方、已掉落和已安装的爆能器（Spike）等动态目标。该数据集包含了近万张精心标注的游戏截图，并提供了目标边界框与类别标签，同时引入了PaliGemma视觉语言模型的标注信息，为多模态学习探索提供了独特数据支撑。自发布以来，该数据集不仅推动了游戏AI在目标感知方向的研究进展，也为智能观战系统、战术分析工具的开发奠定了坚实基础。

当前挑战

该数据集在构建与应用中面临多重挑战。首先，在领域问题层面，游戏场景目标检测区别于自然图像，存在大量小尺寸目标（如远处的敌人）、目标之间严重遮挡、以及光照与特效的剧烈变化，这些因素加剧了目标识别与定位的难度。其次，《无畏契约》作为快节奏射击游戏，目标在连续帧中频繁移动与消失，检测模型需具备实时性与高鲁棒性。在数据集构建过程中，挑战同样显著：从游戏渲染图像中获取高质量的原始帧需要精确控制采样策略，以兼顾场景多样性与类别平衡；对四类目标（包括两类非常见类别“已掉落”与“已安装”的Spike）进行精确标注，需要细粒度的实例级边界框确认，且需在不同地图、视角和武器状态下保持一致性，人工标注工作量巨大且易引入噪声。此外，数据集的规模虽具代表性，但相较于复杂游戏环境，其样本量仍显不足，模型泛化能力面临考验。

常用场景

经典使用场景

在计算机视觉与电子竞技交叉的研究领域中，valorant-object-detection-paligemma数据集为复杂游戏场景下的目标检测任务提供了高质量的训练与评测平台。该数据集聚焦于热门战术射击游戏《Valorant》，其经典使用场景在于训练模型精准识别并定位游戏画面中的四类关键目标：掉落的地刺、敌方角色、已安放的地刺以及己方队友。借助该数据集，研究者能够系统性地开展基于深度学习的游戏内动态目标检测研究，显著提升对快速移动、遮挡频繁、光照多变的电子竞技画面的感知能力，为后续人机对战、游戏辅助及自动化分析奠定坚实基础。

衍生相关工作

该数据集衍生了多个具有影响力的经典工作，深刻推动了游戏视觉理解领域的发展。研究者们基于此数据集率先开展了面向第一人称射击游戏的小目标与遮挡目标检测研究，提出了多尺度特征融合与注意力机制增强的检测网络，显著提升了在游戏动态场景下的检测鲁棒性。随后，该数据集的标注范式被借鉴至其他竞技类游戏，催生了如《Apex Legends》和《Counter-Strike: Global Offensive》等游戏的专用目标检测数据集。同时，结合强化学习与模仿学习，该数据集也被用于训练游戏内自动瞄准与决策模型，开创了电竞AI从感知到决策的端到端研究路径，为构建通用游戏智能体提供了丰富的实验基础与评价基准。

数据集最近研究