T2FPV-ETH

Name: T2FPV-ETH
Creator: 卡内基梅隆大学
Published: 2023-03-02 15:51:07
License: 暂无描述

arXiv2023-03-02 更新2024-06-21 收录

下载链接：

https://github.com/cmubig/T2FPV

下载链接

链接失效反馈

官方服务：

资源简介：

T2FPV-ETH数据集是由卡内基梅隆大学创建的，旨在支持第一人称视角（FPV）轨迹预测研究。该数据集通过模拟真实世界中的顶视图轨迹数据集，生成了所有交互行人的自我中心视觉数据。T2FPV-ETH数据集特别关注由于不完美的检测和跟踪、遮挡以及相机视野限制（FOV）引起的FPV特定错误。数据集的创建过程涉及使用SEANavBench高保真模拟环境，提供真实的合成图像，并提供每个轨迹的历史和未来对应的地面实况。该数据集的应用领域主要集中在解决机器人导航中的FPV错误问题，提高预测性能，减少位移误差。

The T2FPV-ETH dataset was developed by Carnegie Mellon University to support research on first-person view (FPV) trajectory prediction. This dataset generates egocentric visual data for all interacting pedestrians by simulating real-world bird's-eye view trajectory datasets. The T2FPV-ETH dataset specifically focuses on FPV-specific errors caused by imperfect detection and tracking, occlusions, and camera field-of-view (FOV) constraints. The dataset was constructed using the SEANavBench high-fidelity simulation environment, which provides photorealistic synthetic images, and includes corresponding ground truth for both historical and future segments of each trajectory. Its core application scenarios focus on resolving FPV-related errors in robot navigation, enhancing prediction performance, and reducing displacement error.

提供机构：

卡内基梅隆大学

创建时间：

2022-09-23

搜集汇总

数据集介绍

构建方式

在行人轨迹预测领域，构建第一人称视角数据集面临诸多挑战，如视角限制与遮挡问题。T2FPV-ETH数据集通过创新的T2FPV方法，基于经典的ETH/UCY鸟瞰轨迹数据集生成高保真第一人称视觉数据。该方法利用SEANavBench高保真仿真环境，为每个行人轨迹附加模拟摄像头，渲染出RGB图像与实例分割掩码，并采用先进的目标检测与跟踪算法生成感知轨迹。通过可见性过滤与匈牙利匹配，将感知轨迹与真实轨迹关联，最终形成包含部分观测与缺失数据的多视角场景，有效模拟了现实世界中因遮挡和视野限制导致的感知误差。

使用方法

该数据集主要用于训练和评估在第一人称视角下处理部分观测信息的行人轨迹预测算法。研究人员可基于提供的感知轨迹历史（包含缺失数据）来预测所有可见行人的未来轨迹，并以对应的真实未来轨迹作为评估标准。典型使用流程包括：首先采用插值等方法对缺失数据进行初步填补，随后应用轨迹预测模型；为提升性能，可结合论文提出的CoFE模块，以端到端方式联合优化插值修正与轨迹预测。评估时采用平均位移误差和最终位移误差等指标，通过留一法在五个数据折叠上进行交叉验证，以确保结果的稳健性与可比性。

背景与挑战

背景概述

随着自主机器人在共享环境中与人类交互的需求日益增长，行人轨迹预测成为机器人领域的关键研究方向。T2FPV-ETH数据集由卡内基梅隆大学的研究团队于2023年提出，旨在解决现有轨迹预测研究主要依赖鸟瞰视角数据的局限性。该数据集基于经典的ETH/UCY行人轨迹数据集，通过高保真模拟技术生成了每个行人的第一人称视角视觉数据，从而为社交导航研究提供了更贴近真实交互场景的基准。其核心研究问题在于如何从部分感知、存在遮挡和视野限制的自我中心视角中，准确预测行人的未来轨迹，推动了机器人感知与预测一体化研究的发展。

当前挑战

T2FPV-ETH数据集面临的挑战主要体现在两个方面：在领域问题层面，第一人称视角下的行人轨迹预测需应对因遮挡、视野限制及检测跟踪不完美导致的感知数据缺失与噪声，这显著增加了预测模型处理部分观测信息的复杂度；在构建过程层面，数据集创建需克服从鸟瞰轨迹到自我中心视角转换的高保真模拟难题，包括真实感图像渲染、多智能体视角同步，以及感知模块（如检测与跟踪）的集成，以确保生成的数据既贴近现实又具备可重复性。

常用场景

经典使用场景

在机器人社会导航领域，T2FPV-ETH数据集为第一人称视角轨迹预测研究提供了关键支持。该数据集通过高保真模拟环境，将经典的ETH/UCY鸟瞰轨迹数据转化为每个行人的自我中心视觉序列，从而构建了包含遮挡、视野限制及检测跟踪噪声的逼真场景。研究者利用此数据集，能够评估和开发在部分感知条件下预测行人未来轨迹的算法，推动社会感知机器人系统在复杂人群环境中的实际应用。

解决学术问题

T2FPV-ETH数据集主要解决了第一人称视角下轨迹预测中的感知误差问题。传统研究多基于完整的鸟瞰轨迹信息，忽视了实际机器人感知中因遮挡、视野受限及检测跟踪不完美所导致的数据缺失与噪声。该数据集通过模拟生成带有真实感知误差的视觉数据，使得学术界能够系统研究如何在部分观测条件下进行轨迹补全与预测，从而提升算法在真实世界中的鲁棒性与实用性。

实际应用

该数据集的实际应用场景集中于自动驾驶机器人及服务机器人的导航系统开发。在商场、机场或街道等密集人流环境中，机器人需通过自身传感器实时感知周围行人并预测其运动意图。T2FPV-ETH提供的自我中心视觉数据与对应轨迹，可用于训练和测试机器人在存在感知误差时的决策模型，从而增强其在动态社会场景中的安全导航与交互能力。

数据集最近研究