CASTlog
收藏Hugging Face2026-06-30 更新2026-07-01 收录
下载链接:
https://huggingface.co/datasets/BSU-CAST/CASTlog
下载链接
链接失效反馈官方服务:
资源简介:
CASTlog是一个综合性日志数据集,专门记录6-12岁儿童与搜索工具之间的交互过程。该数据集的创建目的是为了解决儿童信息检索领域缺乏可用数据的问题,为研究和开发适应儿童需求的搜索工具提供基础资源。它收录了儿童在完成各类在线信息发现任务过程中产生的搜索查询和用户-系统交互记录,通过捕获儿童在信息检索过程中的实际行为,支持从多角度深入研究儿童搜索行为及其面临的独特障碍。数据集还附有统计数据及基于实证探索的初步分析,可作为研究人员和从业者开发儿童友好型搜索系统的重要参考。
CASTlog is a comprehensive log dataset that records interactions between children aged 6-12 and search tools. The dataset aims to address the lack of available data in the field of childrens information retrieval, providing a foundational resource for research and development of search tools tailored to childrens needs. It includes search queries and user-system interaction records generated by children while completing various online information discovery tasks. By capturing childrens actual behaviors during information retrieval, the dataset supports in-depth multi-angle research on childrens search behaviors and the unique challenges they face. The dataset comes with statistical data and preliminary analyses based on empirical exploration, serving as an important reference for researchers and practitioners in developing child-friendly search systems.
创建时间:
2026-06-23
原始信息汇总
数据集概述
数据集名称:CASTlog
提供机构:BSU-CAST
许可证:MIT
数据集链接:https://huggingface.co/datasets/BSU-CAST/CASTlog
数据集描述
CASTlog 是一个全新的数据集,专门记录儿童(年龄6-12岁)在使用搜索工具时的搜索查询及用户-系统交互行为。该数据集旨在解决当前信息检索领域缺乏儿童搜索行为数据的问题,支持从多个角度展开研究,并推动开发适合儿童信息需求的搜索工具。
数据内容
- 捕获儿童在完成各类在线信息发现任务时的搜索查询。
- 记录用户与系统之间的交互过程。
引用信息
- 文献标题:CASTlog: A Comprehensive Log of Children’s Interactions with the Child Adaptive Search Tool
- 作者:Pinney, Christine; Kennington, Casey; Wright, Katherine Landau; Pera, Sole; Fails, Jerry Alan
- 发表期刊:Information Retrieval Research(IRRJ)
- 卷期:第2卷,第1期
- 出版年份:2026年
- DOI:10.54195/irrj.26178
- 文献链接:https://irrj.org/article/view/26178
搜集汇总
数据集介绍

构建方式
CASTlog数据集由Pinney等人构建,旨在填补儿童信息检索研究中公开数据的匮乏。研究团队招募6至12岁儿童作为受试者,通过设计多样化的在线信息发现任务,系统化地捕获了儿童在搜索过程中的查询行为及人机交互记录。数据收集依托儿童自适应搜索工具(Child Adaptive Search Tool),确保交互环境符合低龄用户的认知特点。该数据集汇聚了儿童用户在真实搜索场景下的操作日志,为深入分析儿童查询策略与行为模式提供了结构化的实证基础。
使用方法
研究者可通过HuggingFace平台直接下载CASTlog,数据采用结构化格式存储,便于利用Python等工具进行批处理与分析。典型应用路径包括:解析儿童查询序列以识别认知模式,对比不同年龄段的交互差异,或作为训练儿童友好型检索模型的基准数据集。使用时需注意数据中可能包含的敏感信息需按MIT许可协议处理,同时建议结合论文中提供的元数据字段说明,确保对交互日志的解读准确反映原始研究语境。
背景与挑战
背景概述
随着数字信息环境的迅猛发展,儿童群体日益频繁地借助搜索工具进行学术探究或娱乐活动。然而,现有检索系统多面向成人设计,未能充分适配6至12岁儿童的认知特征与信息需求,导致其在信息获取各阶段遭遇独特障碍。尽管信息检索领域已对儿童面临的困难有所探讨,但缺乏可用于多维度深入研究的高质量数据,制约了面向年轻用户检索工具的优化进程。为填补这一空白,由Pinney、Kennington、Wright、Pera和Fails等学者于2026年创建了CASTlog数据集,该数据集系统记录了儿童在使用儿童自适应搜索工具过程中的查询语句与用户-系统交互行为,覆盖多种在线信息发现任务。作为该领域的奠基性资源,CASTlog为开发契合儿童信息需求的搜索工具提供了关键数据支撑,对推动儿童信息检索研究具有深远意义。
当前挑战
CASTlog所解决的核心领域挑战在于,现有儿童信息检索研究因缺乏公开、结构化的交互数据而进展迟缓,难以系统识别儿童在查询构建、结果理解及任务完成中的特有困难,导致检索工具的设计长期无法突破以成人为中心的范式。在数据集构建过程中,研究人员面临若干严峻挑战:如何精准捕捉6-12岁儿童在自然搜索情境下的真实行为,避免实验室环境带来的生态效度偏差;如何对年龄跨度较大的用户群体进行语义层级统一的交互标注,以兼容认知发展差异;以及如何在保障儿童隐私与数据伦理的前提下,存储和共享包含敏感信息的搜索日志。这些挑战的克服不仅确立了CASTlog的独特学术价值,也为后续研究提供了方法论参考。
常用场景
经典使用场景
CASTlog数据集专为捕捉6至12岁儿童与搜索系统交互过程而设计,其经典应用场景聚焦于儿童信息检索行为分析。研究人员可利用该数据集剖析年轻用户在完成开放式或任务导向型在线信息发现时的查询模式、点击路径及系统互动特征,从而揭示儿童在信息搜索各阶段面临的独特障碍。该数据集的推出填补了儿童搜索交互数据匮乏的空白,为多角度深入探索提供宝贵资源,助力信息检索社区系统性理解并改进面向低龄用户的搜索体验。
解决学术问题
在学术领域,CASTlog直面儿童信息检索研究中长期存在的核心瓶颈——可公开获取的多维交互数据缺失。此前,限于样本规模或隐私合规,学者难以全面分析儿童搜索的认知与行为演化。该数据集通过标准化记录查询语句、任务类型及系统反馈,为研究儿童搜索策略、误触及认知负荷等问题提供了坚实基础,显著推进了面向儿童的搜索工具优化理论,并为跨年龄段检索行为比较开辟了新路径。
实际应用
实际应用层面,CASTlog驱动着儿童适龄搜索工具的智能化迭代。基于该数据集,开发者可训练模型识别儿童常见查询意图与困难模式,进而设计更精准的自动补全、结果摘要简化及安全过滤功能。教育科技领域亦能借鉴其洞见,构建寓教于乐的发现式学习平台,在保护隐私的同时提升儿童自主信息获取能力,最终弥合成年与儿童用户间存在的信息鸿沟。
数据集最近研究
最新研究方向
当前,随着儿童在线信息搜索行为的日益普及,针对6至12岁儿童用户设计的自适应搜索工具成为信息检索领域的前沿热点。CASTlog数据集应运而生,系统性记录了儿童在完成多样化在线信息发现任务过程中的搜索查询与用户系统交互日志,填补了儿童信息检索行为多视角研究的空白。该数据集不仅提供了详尽的统计分析与初步实证探索,更为研究者深入理解年轻搜索者在信息访问各阶段面临的特有障碍、优化儿童友好的搜索算法与界面设计奠定了坚实基础,对推动公平包容的数字信息环境建设具有重要里程碑意义。
以上内容由遇见数据集搜集并总结生成



