LSC-ADL
收藏arXiv2025-04-03 更新2025-04-07 收录
下载链接:
https://bit.ly/lsc-adl-annotations
下载链接
链接失效反馈官方服务:
资源简介:
LSC-ADL数据集是由越南国家大学胡志明市分校的Minh-Quan Ho-Le等研究人员创建的日常生活活动(ADL)注释 lifelog 数据集。该数据集基于LSC数据集,包含超过70万张图片,通过半自动化的聚类方法和人工在环验证生成了精确的ADL注释,旨在增强检索的可解释性。数据集涵盖了日常生活活动的多模态信息,适用于 lifelog 检索、活动识别和自我中心视觉等研究,可促进 lifelog 检索系统性能的提升和检索内容的可解释性增强。
The LSC-ADL dataset is a daily living activity (ADL) annotated lifelog dataset created by researchers including Minh-Quan Ho-Le from Vietnam National University, Ho Chi Minh City. Built upon the original LSC dataset, this collection contains over 700,000 images, with precise ADL annotations generated via semi-automatic clustering methods and human-in-the-loop validation, aiming to enhance the interpretability of retrieval tasks. The dataset covers multimodal information related to daily living activities, and is applicable to research areas such as lifelog retrieval, activity recognition, and egocentric vision. It can promote the improvement of lifelog retrieval system performance and the enhancement of the interpretability of retrieved contents.
提供机构:
越南国家大学,胡志明市,越南
创建时间:
2025-04-03
搜集汇总
数据集介绍

构建方式
LSC-ADL数据集的构建采用了半自动聚类与人工验证相结合的创新方法。研究团队首先从原始LSC数据集中筛选约75%的图像样本,通过HDBSCAN算法进行类内聚类分析,捕捉日常活动的时空关联性。在标注流程中,结合LLaMA-3.2-11b视觉模型生成描述性文本,并引入GPT模型进行标签建议,最终由20名标注人员完成人工验证。这种混合方法有效平衡了自动化效率与标注准确性,形成了包含35个ADL类别的层次化标注体系。
特点
该数据集的核心价值在于其精细的日常活动标注体系,覆盖了从基础生活行为到专业场景的35个语义类别。数据分布呈现典型的长尾特征,80%样本集中于10个高频活动类别(如使用电脑、办公工作等),同时保留了11个低频率但具有重要语义价值的特殊场景。时序分析表明,各类活动具有明显的昼夜节律特征,如个人卫生活动集中于清晨,而休闲娱乐多发生在晚间,这种自然的时间标注为研究日常行为模式提供了独特维度。
使用方法
研究者可通过官方发布的标注文件(https://bit.ly/lsc-adl-annotations)获取结构化活动标签。数据集支持多模态研究范式,原始图像与ADL标签、时间戳、地理位置等元数据可协同使用。建议采用层次化分类策略处理长尾分布,并利用时序特征增强活动识别模型的上下文感知能力。该数据集特别适合探索基于活动的跨模态检索、日常行为模式分析等研究方向,使用时需注意遵守原始LSC数据集关于隐私保护的各项规定。
背景与挑战
背景概述
LSC-ADL数据集由越南胡志明市科学大学软件工程实验室与爱尔兰都柏林城市大学合作,于2025年基于LSC数据集构建而成。该数据集聚焦于日常生活活动(ADL)的语义标注,通过可穿戴相机采集的第一人称视角图像,为生命日志检索研究提供了结构化活动层注释。研究团队创新性地采用半自动聚类方法结合HDBSCAN算法和人工验证机制,将动作识别融入生命日志分析,填补了现有研究中活动级语义理解的空白。作为首个系统整合ADL标注的自我中心视觉数据集,LSC-ADL为个性化行为模式分析、上下文感知检索等研究方向提供了重要基准。
当前挑战
在解决生命日志活动识别问题时,LSC-ADL需应对三大核心挑战:首先,自我中心视角导致的视觉遮挡和运动模糊严重影响活动边界的判定;其次,日常活动的时序重叠与场景多样性要求算法具备强时序建模能力;再者,长尾分布问题使得罕见活动类别的识别准确率显著降低。在构建过程中,研究团队面临标注一致性与效率的平衡难题——既要通过聚类算法处理70万张图像的庞大规模,又需人工验证确保35类ADL标签的语义精确性。此外,隐私保护要求对原始图像进行面部和文本擦除,进一步增加了视觉特征提取的复杂度。
常用场景
经典使用场景
LSC-ADL数据集在生命日志检索和日常活动识别领域具有经典应用价值。该数据集通过半自动聚类方法标注了35类日常活动,为研究者提供了丰富的第一视角活动数据。在计算机视觉领域,该数据集常被用于开发新型的生命日志检索系统,通过结合活动级别的语义信息,显著提升了检索的准确性和可解释性。其独特的活动标注框架使得研究者能够探索时间序列上的活动模式,为理解人类日常行为提供了重要数据支持。
解决学术问题
LSC-ADL数据集有效解决了生命日志研究中活动级别语义缺失的关键问题。传统生命日志检索主要依赖视觉特征,而该数据集引入了活动识别层,弥补了静态特征无法捕捉时间动态的缺陷。通过提供结构化ADL标注,该数据集支持研究者开发更精准的上下文感知检索模型,同时促进了活动识别与生命日志检索的跨领域融合。这一创新为理解人类行为的时空模式提供了新的研究范式,推动了可解释性检索系统的发展。
衍生相关工作
该数据集已衍生出多个重要研究方向,包括基于多模态融合的实时活动识别系统开发。部分研究团队利用其分层标注结构,探索了跨活动类别的迁移学习框架。在检索领域,衍生工作主要集中开发结合活动语义的混合检索模型,如Ho-Le等人提出的SnapSeek系统。此外,数据集的时间活动分布特征也激发了时序建模的新方法,推动了图神经网络在行为模式预测中的应用。
以上内容由遇见数据集搜集并总结生成



