TrajImpute

Name: TrajImpute
Creator: 印度理工学院鲁尔基分校计算机科学与工程系
Published: 2024-11-01 03:42:42
License: 暂无描述

arXiv2024-11-01 更新2024-11-06 收录

下载链接：

https://github.com/Pranav-chib/TrajImpute

下载链接

链接失效反馈

官方服务：

资源简介：

TrajImpute是由印度理工学院鲁尔基分校计算机科学与工程系创建的一个行人轨迹预测数据集，旨在模拟观测轨迹中的缺失坐标，以增强现实世界的适用性。该数据集包含ETH、HOTEL、UNIV、ZARA1和ZARA2等多个常用行人轨迹预测数据集的轨迹，并引入了缺失观测坐标。数据集的创建过程包括两种数据生成策略：简单模式和困难模式，分别模拟较短和较长持续时间的缺失坐标。TrajImpute主要应用于行人轨迹预测和缺失数据插补领域，旨在解决现实世界中传感器故障、遮挡等问题导致的轨迹数据缺失问题。

TrajImpute is a pedestrian trajectory prediction dataset developed by the Department of Computer Science and Engineering, Indian Institute of Technology Roorkee. It aims to simulate missing coordinates in observed trajectories to enhance real-world applicability. The dataset incorporates trajectories from multiple widely-used pedestrian trajectory prediction datasets including ETH, HOTEL, UNIV, ZARA1 and ZARA2, and introduces missing observed coordinates. Two data generation strategies are employed during its creation: simple mode and difficult mode, which respectively simulate missing coordinates of short and long durations. TrajImpute is mainly applied in the fields of pedestrian trajectory prediction and missing data imputation, targeting to address the issue of missing trajectory data caused by real-world problems such as sensor failures and occlusions.

提供机构：

印度理工学院鲁尔基分校计算机科学与工程系

创建时间：

2024-11-01

原始信息汇总

TrajImpute 数据集概述

数据集下载

下载链接: Download Link
数据结构: 数据集采用字典格式，具体键值结构参考 /TrajImpute.png。

数据生成

数据加载器: 使用与 Social-GAN 相同的数据加载器，代码参考 Social-GAN。
缺失值生成: 缺失值生成代码位于 data_generation.py。
数据生成命令: bash python generate_data.py <data_test_file_path> <data_train_file_path> <data_val_file_path> <save_file_path>

轨迹填补基准测试

数据集

ETH-M, HOTEL-M, UNIV-M, ZARA1-M, ZARA2-M: 包含缺失观测坐标的子集。
协议:
- Easy: $0 leq ext{missing} leq 4$
- Hard: $4 leq ext{missing} leq 7$

方法与结果

数据集	方法	指标	Transformer	US-GAN	BRITS	M-RNN	TimesNet	SAITS
ETH-M	Easy-impute	MAE	3.1318	0.6467	1.4287	5.2558	1.1353	0.5031
		MSE	19.4576	1.8055	4.7339	35.3738	4.9441	0.9909
		RMSE	4.4111	1.3437	2.1758	5.9476	2.2235	0.9954
		MRE	0.5236	0.1081	0.2389	0.8787	0.1898	0.0841
ETH-M	Hard-impute	MAE	3.2249	3.0451	3.0371	5.3309	1.3656	0.9965
		MSE	19.5948	18.0716	17.9457	35.5047	4.9937	2.5934
		RMSE	4.7926	4.2511	4.2362	5.9965	2.5054	1.6104
		MRE	0.5734	0.5100	0.5087	0.8962	0.2287	0.1669
HOTEL-M	Easy-impute	MAE	8.8847	2.6327	3.9033	3.2133	7.4037	2.1930
		MSE	91.5550	13.5993	23.1058	20.0857	124.5438	8.7460
		RMSE	9.5684	3.6877	4.8068	4.4817	11.1599	2.9574
		MRE	2.9468	0.8732	1.2946	1.0658	2.4556	0.7274
HOTEL-M	Hard-impute	MAE	8.9096	7.8833	7.6057	3.2443	7.9484	2.6050
		MSE	92.2607	75.9804	72.0169	20.2543	106.7010	16.0168
		RMSE	9.6478	8.7167	8.4863	4.5005	11.3296	4.0021
		MRE	2.8866	2.6127	2.5207	1.1686	2.6343	0.8634
UNIV-M	Easy-impute	MAE	3.0410	0.9158	1.0171	6.8380	0.6713	0.1939
		MSE	14.0163	2.6297	2.9769	56.9715	0.7631	0.0697
		RMSE	3.7438	1.6216	1.7254	7.5479	0.8736	0.2639
		MRE	0.3905	0.1176	0.1306	0.8780	0.0862	0.0249
UNIV-M	Hard-impute	MAE	3.9795	1.9430	1.8028	6.9148	0.9421	0.6158
		MSE	15.4244	6.1815	5.4057	57.6533	1.5827	0.6003
		RMSE	3.9639	2.4863	2.3250	7.7268	1.2581	0.7748
		MRE	1.0326	0.2495	0.2315	0.9751	0.1210	0.0791
ZARA1-M	Easy-impute	MAE	2.6288	0.4832	0.7307	5.1152	0.3125	0.2054
		MSE	10.0109	0.8599	1.2306	34.9869	0.1768	0.0775
		RMSE	3.1640	0.9273	1.1093	5.9150	0.4204	0.2784
		MRE	0.4326	0.0795	0.1202	0.8417	0.0514	0.0338
ZARA1-M	Hard-impute	MAE	2.7532	2.2846	2.3140	5.1921	0.5699	0.6277
		MSE	10.1228	7.8216	8.0351	35.7821	0.6327	0.8287
		RMSE	3.1816	2.7967	2.8346	5.9976	0.7955	0.9103
		MRE	0.4463	0.3756	0.3805	0.8673	0.0937	0.1032
ZARA2-M	Easy-impute	MAE	2.1301	0.3861	0.5556	5.0905	0.2409	0.1314
		MSE	7.3276	0.6212	0.8292	31.5674	0.1329	0.0385
		RMSE	2.7070	0.7882	0.9106	5.6185	0.3645	0.1963
		MRE	0.3524	0.0639	0.0919	0.8422	0.0399	0.0217
ZARA2-M	Hard-impute	MAE	2.2840	1.8605	1.8051	5.1698	0.5031	0.3632
		MSE	7.6342	5.8511	5.5953	32.3531	0.6525	0.4313
		RMSE	2.8630	2.4189	2.3654	5.8994	0.8077	0.6567
		MRE	0.3735	0.3041	0.2951	0.8465	0.0823	0.0593

轨迹预测基准测试

数据集

ETH, Hotel, UNV, ZARA1, ZARA2: 包含不同填补协议的子集。
协议:
- Clean: 无缺失坐标
- Easy-impute: 简单填补
- Hard-impute: 困难填补

方法与结果

数据集	基线	GraphTern	LBEBM-ET	SGCN-ET	EQmotion	TUTR	GPGraph
ETH	Clean	0.42/0.58	0.36/0.53	0.36/0.57	0.40/0.61	0.40/0.61	0.43/0.63
	Easy-impute	0.77/0.74	0.37/0.55	0.42/0.71	0.46/0.62	0.54/0.73	0.45/0.75
	Hard-impute	0.78/0.77	0.85/1.07	1.07/1.44	0.47/0.63	1.12/1.53	0.92/0.93
Hotel	Clean	0.14/0.23	0.12/0.19	0.13/0.21	0.12/0.18	0.11/0.18	0.18/0.30
	Easy-impute	0.15/0.25	0.13/0.20	0.14/0.23	0.65/0.68	1.31/1.66	0.19/0.31
	Hard-impute	1.68/1.42	3.31/4.13	3.21/3.92	0.72/0.74	3.36/3.95	1.89/1.70
UNV	Clean	0.26/0.45	0.24/0.43	0.24/0.43	0.23/0.43	0.23/0.42	0.24/0.42
	Easy-impute	0.27/0.47	0.30/0.51	0.29/0.51	0.37/0.61	0.31/0.49	0.25/0.44
	Hard-impute	0.50/0.51	0.64/1.01	0.77/1.21	0.39/0.70	0.59/0.85	0.53/0.50
ZARA1	Clean	0.21/0.37	0.19/0.33	0.20/0.35	0.18/0.32	0.18/0.34	0.17/0.31
	Easy-impute	0.22/0.38	0.20/0.35	0.22/0.38	0.27/0.43	0.24/0.41	0.18/0.32
	Hard-impute	0.96/1.25	0.37/0.60	0.61/0.97	0.28/0.44	0.50/0.77	0.58/0.45
ZARA2	Clean	0.17/0.29	0.14/0.24	0.15/0.26	0.13/0.23	0.13/0.25	0.15/0.29
	Easy-impute	0.18/0.30	0.16/0.27	0.17/0.29	0.36/0.54	0.25/0.37	0.29/0.30
	Hard-impute

搜集汇总

数据集介绍

构建方式

TrajImpute数据集的构建基于ETH、HOTEL、UNIV、ZARA1和ZARA2等常用行人轨迹预测数据集，通过引入缺失的观测坐标来模拟真实世界中的传感器故障、遮挡和视野限制等问题。数据生成策略包括‘简单’和‘困难’两种模式。在‘简单’模式中，观测坐标在较短的时间段内缺失；而在‘困难’模式中，观测坐标在较长的时间段内缺失。这种设计确保了数据集能够覆盖多种缺失模式，从而更真实地反映实际应用场景。

特点

TrajImpute数据集的主要特点在于其能够模拟真实世界中常见的数据缺失情况，通过引入缺失的观测坐标，增强了数据集的现实应用性。此外，数据集保持了缺失数据的均匀分布，确保了缺失模式的自然性和多样性。这种设计不仅有助于评估现有插值方法的性能，还为未来研究提供了基础资源，推动了缺失数据感知行人轨迹预测方法的发展。

使用方法

TrajImpute数据集可用于评估和改进现有的行人轨迹预测模型，特别是在处理缺失数据方面的能力。研究者可以使用该数据集来测试和比较不同的插值方法，以确定哪种方法在重建缺失坐标时表现最佳。随后，这些插值后的数据可以用于训练和测试轨迹预测模型，评估其在处理缺失数据时的性能。通过这种方式，TrajImpute数据集为开发更鲁棒和适应性更强的行人轨迹预测系统提供了宝贵的资源。

背景与挑战

背景概述

行人轨迹预测在机器人和自动驾驶车辆等应用中至关重要。近年来，由于行人轨迹数据集的可用性，该领域取得了显著进展，使轨迹预测方法能够从行人的过去运动中学习并预测未来轨迹。然而，这些数据集和方法通常假设观察到的轨迹序列是完整的，忽略了现实世界中传感器故障、遮挡和视野受限等问题，这些问题可能导致观察到的轨迹中存在缺失值。为了应对这一挑战，我们提出了TrajImpute数据集，该数据集模拟了观察轨迹中的缺失坐标，增强了其在现实世界中的适用性。TrajImpute数据集由印度理工学院鲁尔基分校的Pranav Singh Chib和Pravendra Singh创建，旨在为未来的缺失值感知行人轨迹预测研究提供基础资源。

当前挑战

TrajImpute数据集面临的挑战主要集中在两个方面：一是解决行人轨迹预测中缺失值的问题，二是构建过程中模拟缺失坐标的复杂性。在解决领域问题方面，现有的轨迹预测方法通常假设轨迹数据是完整的，而现实世界中由于传感器故障或遮挡等原因，轨迹数据可能存在缺失。这为轨迹预测任务带来了不确定性。在构建过程中，模拟缺失坐标需要考虑多种缺失模式，如连续缺失、间隔缺失等，这增加了数据生成的复杂性。此外，评估和比较不同缺失值插补方法的性能也是一个重要挑战，需要设计合理的评估协议和基准。

常用场景

经典使用场景

TrajImpute数据集的经典使用场景主要集中在行人轨迹预测领域，特别是在处理缺失数据的情况下。该数据集通过模拟真实世界中由于传感器故障、遮挡或视野限制导致的轨迹数据缺失，为研究人员提供了一个评估和改进轨迹预测算法的平台。通过在数据集中引入缺失坐标，TrajImpute使得研究人员能够开发和测试能够有效处理不完整轨迹的算法，从而提高预测的准确性和鲁棒性。

解决学术问题

TrajImpute数据集解决了在行人轨迹预测研究中普遍存在的假设问题，即假设所有观测到的轨迹数据是完整的。这一假设在实际应用中往往不成立，因为传感器故障、遮挡和视野限制等因素会导致数据缺失。通过提供包含缺失坐标的轨迹数据，TrajImpute帮助研究人员开发和评估能够处理不完整数据的算法，从而推动了行人轨迹预测技术的发展，并为实际应用中的轨迹预测提供了更强的理论支持。

衍生相关工作

TrajImpute数据集的发布激发了大量相关研究工作，特别是在轨迹预测和数据插补领域。许多研究者基于TrajImpute数据集开发了新的插补算法和轨迹预测模型，以应对不完整数据带来的挑战。例如，一些研究提出了基于生成对抗网络（GAN）和变分自编码器（VAE）的插补方法，以及结合图神经网络（GNN）和自注意力机制的轨迹预测模型。这些工作不仅提升了轨迹预测的准确性，还为处理缺失数据提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集