TeleEgo
收藏TeleEgo数据集概述
数据集简介
TeleEgo是一个全面的全方位基准测试,专为自我中心视频流中的多人、多场景、多任务和多模态长期记忆推理而设计。该基准测试反映了真实的个人助手场景,在数小时甚至数天内收集连续的自我中心视频数据,要求模型维护和推理记忆、理解和跨记忆推理。
数据集特点
- 全方位覆盖:涵盖角色、场景、任务、模态和记忆视野的全方位评估
- 多模态数据:视频、叙述和语音转录
- 长期记忆推理:专注于真实自我中心场景中的诊断性记忆评估和跨事件推理
数据集规模
- 参与者:5人(性别平衡)
- 场景:
- 工作与学习
- 生活方式与日常
- 社交活动
- 外出与文化
- 录制时长:每人3天(约14.4小时/人)
- 模态:
- 自我中心视频流
- 语音和对话
- 叙述和事件描述
基准测试任务
TeleEgo-QA沿三个主要维度评估模型:
1. 记忆
- 短期/长期/超长期记忆
- 实体追踪
- 时间比较与间隔
2. 理解
- 因果理解
- 意图推断
- 多步推理
- 跨模态理解
3. 跨记忆推理
- 跨时间因果关系
- 跨实体关系
- 时间链理解
每个QA实例包含的问题类型:单选题、多选题、二元题、开放式问题
数据集访问
由于隐私和许可限制,请通过以下链接申请访问: https://huggingface.co/datasets/David0219/TeleEgo
引用
bibtex @misc{yan2025teleegobenchmarkingegocentricai, title={TeleEgo: Benchmarking Egocentric AI Assistants in the Wild}, author={Jiaqi Yan and Ruilong Ren and Jingren Liu and Shuning Xu and Ling Wang and Yiheng Wang and Yun Wang and Long Zhang and Xiangyu Chen and Changzhi Sun and Jixiang Luo and Dell Zhang and Hao Sun and Chi Zhang and Xuelong Li}, year={2025}, eprint={2510.23981}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2510.23981}, }
许可证
- 项目许可证:MIT许可证
- 数据集使用:仅限于研究用途




