five

EgoCampus

收藏
arXiv2025-12-09 更新2025-12-10 收录
下载链接:
https://github.com/ComputerVisionRutgers/EgoCampus
下载链接
链接失效反馈
官方服务:
资源简介:
EgoCampus是由罗格斯大学创建的以行人为中心的户外导航数据集,旨在研究人类在真实世界导航中的视觉注意力。该数据集包含来自82名参与者的32小时多模态视频数据(约350万帧),覆盖25条独特的校园路径,总长度达6公里。数据通过Meta的Project Aria眼镜采集,集成了高分辨率RGB视频、眼动追踪坐标、惯性测量单元(IMU)和GPS等传感器数据。数据集经过严格的隐私处理,包括人脸模糊化。该数据集为研究行人空间注意力提供了宝贵资源,并有望应用于导航系统开发,以模拟人类注意力机制。

EgoCampus is a pedestrian-centric outdoor navigation dataset developed by Rutgers University, designed to investigate human visual attention during real-world navigation. This dataset contains 32 hours of multimodal video data (approximately 3.5 million frames) from 82 participants, covering 25 unique campus routes with a total length of 6 kilometers. The data was collected using Meta's Project Aria smart glasses, and integrates high-resolution RGB video, eye-tracking coordinates, inertial measurement unit (IMU), GPS and other sensor data. The dataset has undergone rigorous privacy processing, including facial blurring. This dataset provides a valuable resource for research on pedestrian spatial attention, and holds promise for applications in navigation system development to simulate human attention mechanisms.
提供机构:
罗格斯大学
创建时间:
2025-12-09
原始信息汇总

EgoCampus 数据集概述

数据集状态

  • 数据集与代码即将发布。

备注

  • 根据提供的README文件内容,目前尚无关于数据集规模、内容、格式、获取方式及使用许可等具体信息。
搜集汇总
数据集介绍
main_image_url
构建方式
在理解人类户外导航中视觉注意力的研究需求背景下,EgoCampus数据集的构建采用了系统化的采集流程。研究团队利用Meta Project Aria眼镜这一集成化设备,在罗格斯大学校园内精心规划了25条总长超过6公里的户外路径。超过80名参与者佩戴该设备沿这些路径行走,设备同步记录了第一人称视角的高清RGB视频、眼球追踪坐标、惯性测量单元数据以及GPS信息。为确保数据的多样性与真实性,采集过程覆盖了不同时段、季节与天气条件。后续处理阶段,原始数据经过时间对齐、视频降尺度以及隐私保护处理(如使用EgoBlur算法模糊未授权人脸),最终形成了包含约3200万帧的多模态连续轨迹数据集。
使用方法
该数据集主要用于开发和评估行人导航中的视觉注意力预测模型。研究者可以加载经过处理的视频帧序列及其对应的凝视坐标与传感器数据,通常以滑动窗口方式采样连续帧作为输入。例如,所提出的EgoCampusNet模型利用预训练的视频编码骨干网络提取时空特征,并与查询帧的图像特征融合,通过解码器预测凝视热图。数据集支持基于留出路径的划分方式进行训练与测试,便于评估模型在未见环境中的泛化能力。其多模态特性也允许探索惯性数据等辅助信息对注意力建模的增强作用,为具身智能与人类-机器人交互等应用提供基础。
背景与挑战
背景概述
EgoCampus数据集由罗格斯大学的研究团队于2025年提出,旨在解决真实世界导航中人类视觉注意力预测的挑战。该数据集聚焦于户外校园环境中的行人自我中心视角,通过Meta Project Aria眼镜同步采集了超过80名参与者的眼动追踪、RGB视频、惯性测量单元及GPS等多模态数据,覆盖了25条独特路径总计6公里。其核心研究问题在于建模行人在动态户外场景中的凝视行为,为具身智能与人类-机器人交互领域提供了关键数据支撑,弥补了现有自我中心数据集在户外导航与眼动信息整合方面的空白。
当前挑战
EgoCampus数据集面临的挑战主要体现在两方面:在领域问题层面,它需应对户外导航场景中人类凝视预测的复杂性,包括动态环境变化、任务导向的注意力分配以及个体行为差异,这些因素使得精准建模凝视模式变得尤为困难;在构建过程中,挑战涉及大规模多模态数据的同步采集与处理,需确保眼动坐标与视频帧的高精度对齐,同时遵守严格的隐私保护协议,如使用EgoBlur算法对未授权行人进行面部模糊化,以符合伦理规范并保障数据可用性。
常用场景
经典使用场景
在计算机视觉与人类行为理解领域,EgoCampus数据集为研究户外导航中的视觉注意力机制提供了关键实验平台。该数据集最经典的应用场景在于训练和评估行人视线预测模型,通过同步采集的自我中心视频、眼动坐标及多模态传感器数据,研究者能够深入分析真实世界行走过程中人类注意力的时空分布规律。其连续路径轨迹与多参与者设计,使得模型能够学习跨个体的共性注视模式,为构建环境感知的注意力模型奠定数据基础。
解决学术问题
EgoCampus数据集有效解决了户外导航场景中眼动数据稀缺的学术研究难题。传统眼动数据集多局限于静态图像或室内任务环境,难以捕捉动态移动中的注意力转移特性。该数据集通过大规模户外校园路径采集,为研究目标导向的视觉注意力提供了真实世界基准,推动了视线预测模型从基于显著性的通用方法向任务依赖的专门化方法演进。其多传感器同步设计进一步促进了跨模态注意力建模研究,为理解人类导航中的认知决策过程提供了实证依据。
实际应用
在现实应用中,EgoCampus数据集为具身智能与机器人导航系统开发提供了重要支持。基于该数据集训练的视线预测模型能够帮助自主机器人理解人类在共享空间中的注意力焦点,从而优化路径规划与人机协作策略。在辅助导航系统设计中,模型可预测行人潜在注视区域,提前警示障碍物或关键路标。数据集提供的连续轨迹与多环境条件数据,也为智能交通系统中的行人行为分析与安全预警系统提供了可靠的训练资源。
数据集最近研究
最新研究方向
在具身智能与人类-机器人交互领域,EgoCampus数据集正推动着室外导航场景中视觉注意力建模的前沿探索。该数据集通过整合多模态传感器数据,为研究真实世界行人眼动行为提供了独特资源,其核心研究方向聚焦于开发能够预测动态环境中任务导向性注视的算法模型。当前热点集中于利用Transformer架构与扩散模型等先进技术,融合时空特征以提升预测精度,同时探索注意力机制在社交导航与障碍规避等复杂场景中的应用潜力。这一进展不仅深化了对人类视觉认知机制的理解,更为自动驾驶、辅助机器人等系统的环境感知与决策能力提供了关键理论基础。
相关研究论文
  • 1
    EgoCampus: Egocentric Pedestrian Eye Gaze Model and Dataset罗格斯大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作