GTA_V_DATASET

github2024-05-22 更新2024-05-31 收录

下载链接：

https://github.com/rathaumons/PoseTReID_DATASET

下载链接

链接失效反馈

官方服务：

资源简介：

GTA_V_DATASET数据集专为测试PoseTReID框架设计，所有视频以16:9比例和1080p分辨率渲染，后调整为720p以适应实时测试场景。数据集提供两种格式的地面实况数据，包括.txt和.csv文件，记录了视频中人物的真实ID。

The GTA_V_DATASET is specifically designed for testing the PoseTReID framework. All videos are rendered at a 16:9 aspect ratio and 1080p resolution, then adjusted to 720p to accommodate real-time testing scenarios. The dataset provides ground truth data in two formats, including .txt and .csv files, which record the true IDs of individuals in the videos.

创建时间：

2020-08-14

原始信息汇总

数据集概述

数据集名称

GTA_V_DATASET

数据集描述

该数据集专为测试 PoseTReID 框架在分布式环境中的人物交互场景而设计。
所有视频以16:9比例渲染，分辨率为1080p，后调整为720p以适应实时测试场景。
地面实况数据以.txt和.csv两种格式提供，包含真实的人物ID（名称）。

数据集更新（2023年）

新的地面实况数据包含边界框信息，格式为[x y width height]和[x1 y1 x2 y2]。
使用pyppbox V3生成，集成以下模块：
- 检测器：YOLO Ultralytics V8
- 跟踪器：SORT
- 重识别器：DeepReID (OSNet-AIN) + 定制模块
每行地面实况文本文件代表一帧中的一个人，包含以下信息：
- 帧索引
- 代表点（x, y）
- 名称ID
- 边界框[x y width height]
- 边界框[x1 y1 x2 y2]

数据集许可证

该数据集遵循Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)许可证。

数据集使用

若在研究中使用此数据集，请引用以下文献：

@INPROCEEDINGS{ptreid9271712, author={Siv, Ratha and Mancas, Matei and Sreng, Sokchenda and Chhun, Sophea and Gosselin, Bernard}, booktitle={2020 12th International Conference on Information Technology and Electrical Engineering (ICITEE)}, title={People Tracking and Re-Identifying in Distributed Contexts: PoseTReID Framework and Dataset}, year={2020}, pages={323-328}, doi={10.1109/ICITEE49829.2020.9271712}}

搜集汇总

数据集介绍

构建方式

GTA_V_DATASET的构建方式独具匠心，首先通过自定义脚本在16:9的宽高比下以1080p的分辨率渲染视频，随后将其降采样至720p，以模拟现实摄像头的实时测试场景。此外，该数据集提供了两种格式的真实标签，即.txt和.csv文件，其中包含了角色的真实ID。2023年的更新版本中，通过使用pyppbox V3及其模块（包括YOLO Ultralytics V8检测器、SORT跟踪器和DeepReID ReIDer）生成了包含边界框信息的半自动真实标签，进一步提升了数据集的实用性和准确性。

使用方法

使用GTA_V_DATASET时，用户可以通过pip安装pyppbox-data-gta5包，直接访问和处理数据集。数据集中的每个视频文件都附带了两种格式的真实标签，用户可以根据需要选择使用.txt或.csv文件。此外，数据集的更新版本中，通过pyppbox V3生成的半自动真实标签提供了更为详细的边界框信息，有助于进行更精确的模型训练和评估。对于结果和评估工具，用户可以参考pyppbox项目以获取更多支持。

背景与挑战

背景概述

GTA_V_DATASET是由Numediart研究所开发，专门用于测试PoseTReID框架在分布式环境中的人员跟踪与重识别能力。该数据集创建于2020年，主要研究人员包括Ratha Siv、Matei Mancas等，其核心研究问题是如何在复杂的多摄像头场景中有效跟踪和重识别特定个体。通过在虚拟环境中模拟真实世界的摄像头布局和人物交互，GTA_V_DATASET为研究人员提供了一个高度仿真的测试平台，极大地推动了人员跟踪与重识别技术的发展。

当前挑战

GTA_V_DATASET在构建过程中面临的主要挑战包括：首先，如何在虚拟环境中生成高度逼真的视频数据，以确保测试结果的有效性；其次，如何准确地标注视频中的个体，提供可靠的地面实况数据。此外，数据集的更新和维护也是一个持续的挑战，特别是在技术不断进步的情况下，需要不断优化和调整数据集以适应新的算法和模型。这些挑战不仅影响了数据集的质量，也对相关研究提出了更高的要求。

常用场景

经典使用场景

GTA_V_DATASET 数据集主要用于测试 PoseTReID 框架在分布式环境中对人物的跟踪和重识别能力。该数据集通过在虚拟环境中渲染高分辨率视频，并将其降采样至720p，模拟了现实世界中的摄像头场景。每个视频都提供了详细的地面实况信息，包括人物的边界框和身份标识，这使得研究人员能够在复杂的场景中评估和优化人物跟踪和重识别算法。

解决学术问题

GTA_V_DATASET 数据集解决了在分布式环境中人物跟踪和重识别的学术研究问题。通过提供高质量的视频数据和详细的地面实况信息，该数据集为研究人员提供了一个理想的平台，用于开发和验证新的算法，特别是在多摄像头和长时间跨度的场景中。这不仅推动了计算机视觉领域的发展，还为实际应用中的安全监控和智能系统提供了理论支持。

实际应用

在实际应用中，GTA_V_DATASET 数据集可以用于开发和优化智能监控系统，特别是在大型公共场所如购物中心和游乐园中。通过利用该数据集训练的模型，可以实现对特定人物的持续跟踪和重识别，从而提高安全监控的效率和准确性。此外，该数据集还可用于开发自动驾驶系统中的人车交互模块，提升系统的环境感知能力。

数据集最近研究