five

用户针对可解释机器人的问题数据集

收藏
arXiv2025-10-18 更新2025-11-05 收录
下载链接:
https://github.com/lwachowiak/xai-questions-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由伦敦国王学院的研究团队收集,包含1,893个针对家庭机器人的用户问题,这些问题由100名参与者提供,并根据不同的任务分为12个类别和70个子类别。数据集内容涵盖了机器人执行任务时的细节、机器人的能力、性能评估等多个方面,旨在帮助机器人研究者了解用户可能提出的问题类型,从而设计出能够回答这些问题的机器人。数据集的创建过程包括展示机器人执行任务的15个视频和7个文本刺激,然后让参与者提出他们在每种情况下想要问机器人的问题。数据集的应用领域主要包括可解释人工智能(XAI)的研究,为XAI和问答系统的基准测试提供基础,以及设计符合用户需求的解释策略。

This dataset was collected by a research team from King's College London. It contains 1,893 user questions regarding home robots, which were submitted by 100 participants and categorized into 12 main categories and 70 sub-categories based on task types. The dataset covers multiple dimensions including task execution details of robots, robot capabilities, and performance evaluation, with the aim of helping robotics researchers understand the spectrum of user questions, so as to develop robots capable of responding to such queries. The dataset creation workflow included displaying 15 task-execution videos and 7 textual prompts of home robots, then inviting participants to propose any questions they would wish to ask the robot in the presented scenarios. The primary application fields of this dataset cover explainable artificial intelligence (XAI) research, providing foundational resources for benchmarking XAI systems and question answering systems, as well as designing explanation strategies tailored to user requirements.
提供机构:
伦敦国王学院
创建时间:
2025-10-18
搜集汇总
数据集介绍
main_image_url
构建方式
在可解释机器人研究领域,为系统化收集用户对家用机器人的自然语言提问,本研究通过在线平台招募100名参与者,采用15段视频刺激与7段文本刺激相结合的方式构建数据集。视频素材选取自公开的机器人演示视频,涵盖床铺整理、餐具清洁等多样化家庭任务场景;文本刺激则模拟机器人任务执行报告。每位参与者在观看/阅读每个刺激材料后,需根据标准化提示语提供两个与机器人行为直接相关的问题,最终通过人工归纳编码形成包含1,893个问题的结构化语料。
使用方法
该数据集为机器人自然语言交互系统的开发提供多维度应用支持。研究人员可依据问题分类体系,系统化设计机器人运行时的数据记录规范,确保对话系统能基于真实执行日志生成可靠回答。在评估层面,数据集可作为机器人问答模块的基准测试工具,通过对比系统回答与用户预期验证解释生成质量。此外,针对不同用户群体的问题偏好差异,开发者可据此构建自适应解释策略,例如为新手用户优先提供环境状态说明,而为经验用户重点呈现决策逻辑分析。
背景与挑战
背景概述
随着机器人在共享环境中与人类协同工作的普及,自然语言交互成为提升透明度和信任的关键。2025年,伦敦国王学院安全可信人工智能中心的Lennart Wachowiak等人发布了用户针对可解释机器人的问题数据集,旨在系统化探索家庭服务机器人应具备的问答能力。该研究通过视频与文本刺激收集了1893个用户问题,涵盖任务执行细节、能力评估、假设场景应对等12个核心类别,为机器人日志设计、问答模块基准测试及解释策略优化提供了实证基础。
当前挑战
该数据集需应对两大核心挑战:其一,在领域问题层面,需解决机器人对多样化用户问题的语义理解与真实应答能力,避免大型语言模型因缺乏实际数据而产生虚构回答;其二,在构建过程中,需克服用户意图歧义性标注的困难,例如部分问题可能同时涉及行为评估与纠错意图,同时需通过多模态刺激平衡视频与文本场景引发的提问差异,确保数据集的生态效度与泛化能力。
常用场景
经典使用场景
在可解释机器人研究领域,该数据集为构建自然语言问答系统提供了关键基础。通过收集1893个用户对家庭机器人的真实提问,研究人员能够深入理解用户在与机器人交互时的信息需求模式。这些涵盖12个主要类别和70个子类别的问题,从简单的执行细节查询到复杂的假设情景探讨,为开发具有上下文感知能力的对话系统奠定了实证基础。
解决学术问题
该数据集有效解决了可解释人工智能领域长期存在的用户需求认知偏差问题。传统研究过度聚焦于解释性“为什么”类问题,而本数据集揭示了用户更关注潜在问题处理(重要性评分4.01/5)和知识来源理解(3.95/5)等维度。通过建立层次化问题分类体系,为机器人日志数据收集、解释策略设计和问答模块基准测试提供了理论框架,显著提升了人机交互的透明度和信任校准能力。
实际应用
在实际部署场景中,该数据集直接指导服务机器人的功能设计。基于用户对任务执行细节(22.5%)、机器人能力(12.7%)和性能评估(11.3%)的高频提问,开发者可优化机器人的传感器配置和数据记录策略。在智能家居、医疗护理等具体应用环境中,这些实证数据帮助构建更符合用户心理模型的解释生成系统,特别是在处理突发状况和异常操作时提供精准的语义理解支持。
数据集最近研究
最新研究方向
随着可解释人工智能在机器人领域的深入发展,用户对机器人问答能力的需求日益多样化。该数据集揭示了当前研究正从传统的因果解释转向多维度问题类型探索,重点关注用户对潜在风险场景、任务执行细节及能力边界的询问。前沿方向包括构建基于真实用户需求的问答模块基准测试体系,以及通过分析用户经验差异优化个性化解释策略。这些研究不仅推动了机器人日志数据采集标准的完善,还为自然语言接口设计提供了实证基础,显著提升了人机协作的透明度和信任校准效率。
相关研究论文
  • 1
    通过伦敦国王学院 · 2025年
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务