SimpleToM-rich
收藏Hugging Face2025-06-07 更新2025-06-08 收录
下载链接:
https://huggingface.co/datasets/allenai/SimpleToM-rich
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了四种类型的问题和故事相关的数据:行为问题回答(behavior-qa)、判断问题回答(judgment-qa)、心理状态问题回答(mental-state-qa)和故事数据(story-data)。每种类型的数据都包含了故事文本、问题、选项和答案等信息。故事数据还包含了关于故事严重性、危害性和不道德性的预测信息。
提供机构:
Allen Institute for AI
创建时间:
2025-06-07
搜集汇总
数据集介绍

构建方式
在心理理论评估领域,SimpleToM-rich数据集通过结构化故事生成与多维度标注构建而成。研究者采用人工编写与模型生成相结合的方式,创建了包含丰富社会情境的叙事文本,每个故事均标注了实体关系、行为序列和心理状态变化。数据集进一步通过专业标注团队对道德判断、伤害性预测等维度进行精细化标注,确保数据具有高度的语义复杂性和逻辑一致性。
特点
该数据集的核心特征体现在其多模态评估框架与细粒度标注体系。包含行为判断、心理状态推理和道德评价三大任务模块,每个故事均配有实体映射、关键信息提取及问题-答案对。数据集特别引入了伤害性和非道德性预测指标,并采用多模型标注验证机制,为心理理论计算模型提供兼具广度与深度的评估基准。
使用方法
研究者可通过加载不同配置模块分别访问行为问答、判断问答和心理状态问答子集。使用时应首先解析故事文本与关联的元数据,继而利用提供的问题-答案对进行模型训练或评估。对于高级应用,可结合故事富文本版本与预测指标数据,开展多维度心理理论能力分析,建议采用分层加载策略以优化内存使用效率。
背景与挑战
背景概述
SimpleToM-rich数据集诞生于人工智能理论心智研究的关键发展阶段,由前沿学术机构于2023年推出,旨在深化机器对人类心理状态的理解能力。该数据集通过构建多维度社会情境叙事,聚焦于心理状态推理、行为动机判断及道德伦理评估等核心认知科学问题,为推进具有人类式心理理论的人工智能系统提供了重要实验基准,显著促进了认知计算与伦理人工智能的跨学科融合。
当前挑战
数据集需解决心理状态动态建模的复杂性挑战,包括多层级意图推理、情感因果关联解构以及道德判断的语境依赖性。构建过程中面临叙事逻辑一致性维护、多模态心理标注体系建立,以及跨文化伦理价值观标准化等难题,同时需确保生成文本的语义深度与标注者主观判断间的平衡。
常用场景
经典使用场景
在心理理论研究中,SimpleToM-rich数据集通过精心设计的叙事场景和问答对,为评估计算模型的心理状态推理能力提供了标准化的测试平台。该数据集包含行为判断、道德评价和心理状态推断等多维度任务,能够系统检验模型对故事角色信念、意图和情感的理解深度,成为认知计算领域的重要基准工具。
实际应用
在人工智能伦理评估和人机交互系统设计中,SimpleToM-rich数据集可作为核心测试工具用于验证社交机器人的心理推理能力。其丰富的叙事场景能够模拟真实社交情境,帮助开发更符合人类认知模式的对话系统,在心理健康辅助诊断、教育机器人情感交互等领域具有重要应用价值。
衍生相关工作
基于该数据集衍生的研究显著推进了心理理论计算建模的发展,催生了诸如ToMNet、心理状态预测网络等创新架构。这些工作通过结合神经网络与符号推理,在多层次心理状态建模方面取得突破,为构建具有社会认知能力的智能体奠定了理论基础,并促进了认知科学与人工智能的深度交叉。
以上内容由遇见数据集搜集并总结生成



