five

TrajImpute

收藏
arXiv2024-11-01 更新2024-11-06 收录
下载链接:
https://github.com/Pranav-chib/TrajImpute
下载链接
链接失效反馈
官方服务:
资源简介:
TrajImpute是由印度理工学院鲁尔基分校计算机科学与工程系创建的一个行人轨迹预测数据集,旨在模拟观测轨迹中的缺失坐标,以增强现实世界的适用性。该数据集包含ETH、HOTEL、UNIV、ZARA1和ZARA2等多个常用行人轨迹预测数据集的轨迹,并引入了缺失观测坐标。数据集的创建过程包括两种数据生成策略:简单模式和困难模式,分别模拟较短和较长持续时间的缺失坐标。TrajImpute主要应用于行人轨迹预测和缺失数据插补领域,旨在解决现实世界中传感器故障、遮挡等问题导致的轨迹数据缺失问题。

TrajImpute is a pedestrian trajectory prediction dataset developed by the Department of Computer Science and Engineering, Indian Institute of Technology Roorkee. It aims to simulate missing coordinates in observed trajectories to enhance real-world applicability. The dataset incorporates trajectories from multiple widely-used pedestrian trajectory prediction datasets including ETH, HOTEL, UNIV, ZARA1 and ZARA2, and introduces missing observed coordinates. Two data generation strategies are employed during its creation: simple mode and difficult mode, which respectively simulate missing coordinates of short and long durations. TrajImpute is mainly applied in the fields of pedestrian trajectory prediction and missing data imputation, targeting to address the issue of missing trajectory data caused by real-world problems such as sensor failures and occlusions.
提供机构:
印度理工学院鲁尔基分校计算机科学与工程系
创建时间:
2024-11-01
原始信息汇总

TrajImpute 数据集概述

数据集下载

  • 下载链接: Download Link
  • 数据结构: 数据集采用字典格式,具体键值结构参考 /TrajImpute.png

数据生成

  • 数据加载器: 使用与 Social-GAN 相同的数据加载器,代码参考 Social-GAN
  • 缺失值生成: 缺失值生成代码位于 data_generation.py
  • 数据生成命令: bash python generate_data.py <data_test_file_path> <data_train_file_path> <data_val_file_path> <save_file_path>

轨迹填补基准测试

数据集

  • ETH-M, HOTEL-M, UNIV-M, ZARA1-M, ZARA2-M: 包含缺失观测坐标的子集。
  • 协议:
    • Easy: $0 leq ext{missing} leq 4$
    • Hard: $4 leq ext{missing} leq 7$

方法与结果

数据集 方法 指标 Transformer US-GAN BRITS M-RNN TimesNet SAITS
ETH-M Easy-impute MAE 3.1318 0.6467 1.4287 5.2558 1.1353 0.5031
MSE 19.4576 1.8055 4.7339 35.3738 4.9441 0.9909
RMSE 4.4111 1.3437 2.1758 5.9476 2.2235 0.9954
MRE 0.5236 0.1081 0.2389 0.8787 0.1898 0.0841
ETH-M Hard-impute MAE 3.2249 3.0451 3.0371 5.3309 1.3656 0.9965
MSE 19.5948 18.0716 17.9457 35.5047 4.9937 2.5934
RMSE 4.7926 4.2511 4.2362 5.9965 2.5054 1.6104
MRE 0.5734 0.5100 0.5087 0.8962 0.2287 0.1669
HOTEL-M Easy-impute MAE 8.8847 2.6327 3.9033 3.2133 7.4037 2.1930
MSE 91.5550 13.5993 23.1058 20.0857 124.5438 8.7460
RMSE 9.5684 3.6877 4.8068 4.4817 11.1599 2.9574
MRE 2.9468 0.8732 1.2946 1.0658 2.4556 0.7274
HOTEL-M Hard-impute MAE 8.9096 7.8833 7.6057 3.2443 7.9484 2.6050
MSE 92.2607 75.9804 72.0169 20.2543 106.7010 16.0168
RMSE 9.6478 8.7167 8.4863 4.5005 11.3296 4.0021
MRE 2.8866 2.6127 2.5207 1.1686 2.6343 0.8634
UNIV-M Easy-impute MAE 3.0410 0.9158 1.0171 6.8380 0.6713 0.1939
MSE 14.0163 2.6297 2.9769 56.9715 0.7631 0.0697
RMSE 3.7438 1.6216 1.7254 7.5479 0.8736 0.2639
MRE 0.3905 0.1176 0.1306 0.8780 0.0862 0.0249
UNIV-M Hard-impute MAE 3.9795 1.9430 1.8028 6.9148 0.9421 0.6158
MSE 15.4244 6.1815 5.4057 57.6533 1.5827 0.6003
RMSE 3.9639 2.4863 2.3250 7.7268 1.2581 0.7748
MRE 1.0326 0.2495 0.2315 0.9751 0.1210 0.0791
ZARA1-M Easy-impute MAE 2.6288 0.4832 0.7307 5.1152 0.3125 0.2054
MSE 10.0109 0.8599 1.2306 34.9869 0.1768 0.0775
RMSE 3.1640 0.9273 1.1093 5.9150 0.4204 0.2784
MRE 0.4326 0.0795 0.1202 0.8417 0.0514 0.0338
ZARA1-M Hard-impute MAE 2.7532 2.2846 2.3140 5.1921 0.5699 0.6277
MSE 10.1228 7.8216 8.0351 35.7821 0.6327 0.8287
RMSE 3.1816 2.7967 2.8346 5.9976 0.7955 0.9103
MRE 0.4463 0.3756 0.3805 0.8673 0.0937 0.1032
ZARA2-M Easy-impute MAE 2.1301 0.3861 0.5556 5.0905 0.2409 0.1314
MSE 7.3276 0.6212 0.8292 31.5674 0.1329 0.0385
RMSE 2.7070 0.7882 0.9106 5.6185 0.3645 0.1963
MRE 0.3524 0.0639 0.0919 0.8422 0.0399 0.0217
ZARA2-M Hard-impute MAE 2.2840 1.8605 1.8051 5.1698 0.5031 0.3632
MSE 7.6342 5.8511 5.5953 32.3531 0.6525 0.4313
RMSE 2.8630 2.4189 2.3654 5.8994 0.8077 0.6567
MRE 0.3735 0.3041 0.2951 0.8465 0.0823 0.0593

轨迹预测基准测试

数据集

  • ETH, Hotel, UNV, ZARA1, ZARA2: 包含不同填补协议的子集。
  • 协议:
    • Clean: 无缺失坐标
    • Easy-impute: 简单填补
    • Hard-impute: 困难填补

方法与结果

数据集 基线 GraphTern LBEBM-ET SGCN-ET EQmotion TUTR GPGraph
ETH Clean 0.42/0.58 0.36/0.53 0.36/0.57 0.40/0.61 0.40/0.61 0.43/0.63
Easy-impute 0.77/0.74 0.37/0.55 0.42/0.71 0.46/0.62 0.54/0.73 0.45/0.75
Hard-impute 0.78/0.77 0.85/1.07 1.07/1.44 0.47/0.63 1.12/1.53 0.92/0.93
Hotel Clean 0.14/0.23 0.12/0.19 0.13/0.21 0.12/0.18 0.11/0.18 0.18/0.30
Easy-impute 0.15/0.25 0.13/0.20 0.14/0.23 0.65/0.68 1.31/1.66 0.19/0.31
Hard-impute 1.68/1.42 3.31/4.13 3.21/3.92 0.72/0.74 3.36/3.95 1.89/1.70
UNV Clean 0.26/0.45 0.24/0.43 0.24/0.43 0.23/0.43 0.23/0.42 0.24/0.42
Easy-impute 0.27/0.47 0.30/0.51 0.29/0.51 0.37/0.61 0.31/0.49 0.25/0.44
Hard-impute 0.50/0.51 0.64/1.01 0.77/1.21 0.39/0.70 0.59/0.85 0.53/0.50
ZARA1 Clean 0.21/0.37 0.19/0.33 0.20/0.35 0.18/0.32 0.18/0.34 0.17/0.31
Easy-impute 0.22/0.38 0.20/0.35 0.22/0.38 0.27/0.43 0.24/0.41 0.18/0.32
Hard-impute 0.96/1.25 0.37/0.60 0.61/0.97 0.28/0.44 0.50/0.77 0.58/0.45
ZARA2 Clean 0.17/0.29 0.14/0.24 0.15/0.26 0.13/0.23 0.13/0.25 0.15/0.29
Easy-impute 0.18/0.30 0.16/0.27 0.17/0.29 0.36/0.54 0.25/0.37 0.29/0.30
Hard-impute
搜集汇总
数据集介绍
main_image_url
构建方式
TrajImpute数据集的构建基于ETH、HOTEL、UNIV、ZARA1和ZARA2等常用行人轨迹预测数据集,通过引入缺失的观测坐标来模拟真实世界中的传感器故障、遮挡和视野限制等问题。数据生成策略包括‘简单’和‘困难’两种模式。在‘简单’模式中,观测坐标在较短的时间段内缺失;而在‘困难’模式中,观测坐标在较长的时间段内缺失。这种设计确保了数据集能够覆盖多种缺失模式,从而更真实地反映实际应用场景。
特点
TrajImpute数据集的主要特点在于其能够模拟真实世界中常见的数据缺失情况,通过引入缺失的观测坐标,增强了数据集的现实应用性。此外,数据集保持了缺失数据的均匀分布,确保了缺失模式的自然性和多样性。这种设计不仅有助于评估现有插值方法的性能,还为未来研究提供了基础资源,推动了缺失数据感知行人轨迹预测方法的发展。
使用方法
TrajImpute数据集可用于评估和改进现有的行人轨迹预测模型,特别是在处理缺失数据方面的能力。研究者可以使用该数据集来测试和比较不同的插值方法,以确定哪种方法在重建缺失坐标时表现最佳。随后,这些插值后的数据可以用于训练和测试轨迹预测模型,评估其在处理缺失数据时的性能。通过这种方式,TrajImpute数据集为开发更鲁棒和适应性更强的行人轨迹预测系统提供了宝贵的资源。
背景与挑战
背景概述
行人轨迹预测在机器人和自动驾驶车辆等应用中至关重要。近年来,由于行人轨迹数据集的可用性,该领域取得了显著进展,使轨迹预测方法能够从行人的过去运动中学习并预测未来轨迹。然而,这些数据集和方法通常假设观察到的轨迹序列是完整的,忽略了现实世界中传感器故障、遮挡和视野受限等问题,这些问题可能导致观察到的轨迹中存在缺失值。为了应对这一挑战,我们提出了TrajImpute数据集,该数据集模拟了观察轨迹中的缺失坐标,增强了其在现实世界中的适用性。TrajImpute数据集由印度理工学院鲁尔基分校的Pranav Singh Chib和Pravendra Singh创建,旨在为未来的缺失值感知行人轨迹预测研究提供基础资源。
当前挑战
TrajImpute数据集面临的挑战主要集中在两个方面:一是解决行人轨迹预测中缺失值的问题,二是构建过程中模拟缺失坐标的复杂性。在解决领域问题方面,现有的轨迹预测方法通常假设轨迹数据是完整的,而现实世界中由于传感器故障或遮挡等原因,轨迹数据可能存在缺失。这为轨迹预测任务带来了不确定性。在构建过程中,模拟缺失坐标需要考虑多种缺失模式,如连续缺失、间隔缺失等,这增加了数据生成的复杂性。此外,评估和比较不同缺失值插补方法的性能也是一个重要挑战,需要设计合理的评估协议和基准。
常用场景
经典使用场景
TrajImpute数据集的经典使用场景主要集中在行人轨迹预测领域,特别是在处理缺失数据的情况下。该数据集通过模拟真实世界中由于传感器故障、遮挡或视野限制导致的轨迹数据缺失,为研究人员提供了一个评估和改进轨迹预测算法的平台。通过在数据集中引入缺失坐标,TrajImpute使得研究人员能够开发和测试能够有效处理不完整轨迹的算法,从而提高预测的准确性和鲁棒性。
解决学术问题
TrajImpute数据集解决了在行人轨迹预测研究中普遍存在的假设问题,即假设所有观测到的轨迹数据是完整的。这一假设在实际应用中往往不成立,因为传感器故障、遮挡和视野限制等因素会导致数据缺失。通过提供包含缺失坐标的轨迹数据,TrajImpute帮助研究人员开发和评估能够处理不完整数据的算法,从而推动了行人轨迹预测技术的发展,并为实际应用中的轨迹预测提供了更强的理论支持。
衍生相关工作
TrajImpute数据集的发布激发了大量相关研究工作,特别是在轨迹预测和数据插补领域。许多研究者基于TrajImpute数据集开发了新的插补算法和轨迹预测模型,以应对不完整数据带来的挑战。例如,一些研究提出了基于生成对抗网络(GAN)和变分自编码器(VAE)的插补方法,以及结合图神经网络(GNN)和自注意力机制的轨迹预测模型。这些工作不仅提升了轨迹预测的准确性,还为处理缺失数据提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作