five

SaL-Lightning Dataset

收藏
arXiv2022-01-07 更新2024-06-21 收录
下载链接:
https://doi.org/10.25835/0062363
下载链接
链接失效反馈
官方服务:
资源简介:
SaL-Lightning数据集是由莱布尼茨信息中心科学技术等多个机构合作创建,包含114名参与者的搜索和眼动行为、资源交互及知识获取的详细记录。数据集通过实验室研究收集,参与者需学习雷电形成相关知识,并通过前后测试评估知识变化。数据集内容丰富,包括屏幕录像、访问网页、浏览历史等,旨在支持搜索即学习领域的研究,解决学习过程中的资源推荐、用户行为分析等问题。

The SaL-Lightning dataset was collaboratively created by multiple institutions including the Leibniz Information Centre for Science and Technology and other relevant organizations. It contains detailed records of search behaviors, eye-tracking patterns, resource interactions and knowledge acquisition from 114 participants. The dataset was collected via laboratory studies, where participants were required to learn knowledge related to the formation of lightning, and their knowledge changes were evaluated through pre- and post-tests. With rich contents including screen recordings, webpage access logs, browsing histories and more, this dataset aims to support research in the field of search-as-learning, addressing issues such as resource recommendation and user behavior analysis during the learning process.
提供机构:
莱布尼茨信息中心科学技术
创建时间:
2022-01-07
搜集汇总
数据集介绍
main_image_url
构建方式
在搜索即学习研究领域,构建能够捕捉用户搜索行为与知识获取过程的数据集至关重要。SaL-Lightning数据集通过一项精心设计的用户研究构建而成,该研究邀请了114名德语母语的大学生参与,要求他们在网络环境中自主学习关于雷电形成的科学主题。研究采用前后测设计,通过多项选择题和自由回忆式短文任务量化参与者的知识状态变化。技术层面,研究结合了SMI眼动追踪系统与定制浏览器插件,同步记录屏幕活动、网页浏览时间线、眼动坐标及超过百万次的用户交互事件,确保了行为数据的多维性与精确性。
特点
该数据集的核心特点在于其前所未有的多模态与综合性。它不仅涵盖了传统的搜索日志和网页内容,还整合了高精度的眼动追踪数据、详细的鼠标与键盘交互事件,以及丰富的用户认知能力与心理特质问卷结果。这种设计使得数据集能够同时反映外部行为轨迹与内部认知状态,为理解学习过程中的资源选择、注意力分配与知识建构提供了立体视角。其数据结构的层次化组织,如按时间线、事件类型和知识指标分别存储,既保证了数据的可追溯性,也便于针对不同研究问题进行灵活提取与分析。
使用方法
研究人员可利用该数据集探索搜索即学习领域的多个核心议题。例如,通过关联行为序列、资源特征与知识增益分数,可以构建模型预测学习成效或评估不同多媒体资源对学习的适宜性。眼动与交互事件数据可用于分析用户在复杂信息环境中的认知负荷与元认知策略。此外,结合认知能力问卷数据,能够深入研究个体差异如何调节搜索行为与学习结果之间的关系。数据集已成功应用于知识预测、认知能力与搜索任务关联以及元认知判断等具体研究中,展示了其在推动跨学科研究方面的实用价值。
背景与挑战
背景概述
在信息检索与认知科学交叉领域,搜索即学习(Search as Learning, SAL)作为一个新兴研究方向,致力于探究网络环境如何通过现代信息系统促进个体学习过程。SaL-Lightning数据集由德国莱布尼茨科学中心、汉诺威大学L3S研究中心及知识媒体研究所等机构的跨学科团队于2022年创建,旨在通过严谨的用户实验捕捉学习者在自主网络搜索中的多维度行为数据与知识状态变化。该数据集以雷电形成为主题,记录了114名参与者在搜索前后通过选择题与自由回忆作文测量的知识增益,同时整合了屏幕录像、网页内容、眼动轨迹及交互事件等丰富特征,为理解多媒体资源消费与学习成效的关联提供了实证基础,推动了检索算法优化与个性化学习支持系统的研究进展。
当前挑战
SaL-Lightning数据集所应对的核心挑战在于如何量化并预测开放网络环境中动态、非结构化的学习过程。具体而言,搜索即学习领域需解决学习进程的实时检测与资源适配性评估难题,这要求数据集能同时捕获行为模式与知识演变,而传统数据集往往仅侧重单一维度。在构建过程中,研究团队面临三重挑战:其一,实验设计需平衡生态效度与可控性,既要模拟真实搜索场景,又需避免外部干扰;其二,知识测量工具的开发涉及领域知识校准与项目难度调控,以确保评估的敏感性与可靠性;其三,数据采集需克服技术局限,例如开发非侵入式日志系统以同步记录多源异构数据,并处理网络内容动态性导致的网页存档缺失问题,这些挑战共同凸显了跨学科协作在数据集构建中的关键作用。
常用场景
经典使用场景
在搜索即学习研究领域,SaL-Lightning数据集被广泛应用于探索用户在开放网络环境中进行自我调节学习时的行为模式与知识获取机制。该数据集通过记录114名参与者在学习雷电形成主题时的完整搜索过程,包括屏幕录像、眼动轨迹、浏览事件及资源交互等多模态数据,为研究者提供了分析多媒体资源消费与知识增益之间关联的实证基础。其经典使用场景涉及构建预测模型,以评估不同资源类型(如文本、视频)对学习效果的影响,从而优化信息检索系统在支持学习任务时的效能。
衍生相关工作
SaL-Lightning数据集已衍生出多项经典研究工作,这些研究深入挖掘了数据集中多维度信息的潜力。例如,Otto等人利用资源特征与行为数据预测知识增益,揭示了多媒体布局对学习效果的影响;Pardi等人则聚焦认知能力与资源消费时间的关系,分析了工作记忆容量如何调节不同媒介类型的学习成效;Hoyer等人通过元认知判断数据,探讨了学习后知识自信度的变化模式,指出了短期网络学习可能带来的认知偏差。这些工作共同拓展了搜索即学习理论框架,并为后续研究提供了方法论范例。
数据集最近研究
最新研究方向
在搜索即学习(Search as Learning, SAL)这一新兴交叉领域,SaL-Lightning数据集正推动着前沿研究的深入发展。该数据集通过整合多模态行为数据(如眼动追踪、浏览事件)与知识增益评估,为理解网络搜索中的学习机制提供了丰富资源。当前研究热点聚焦于利用机器学习模型预测学习成果,探索认知能力与资源交互的关联,以及分析元认知判断在自主学习中的作用。这些方向不仅深化了对多媒体资源设计优化的认识,也为个性化检索系统与适应性学习环境的构建奠定了实证基础,对教育技术与信息检索领域的融合具有重要启示意义。
相关研究论文
  • 1
    SaL-Lightning Dataset: Search and Eye Gaze Behavior, Resource Interactions and Knowledge Gain during Web Search莱布尼茨信息中心科学技术 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作