SimpleToM-rich

Name: SimpleToM-rich
Creator: Allen Institute for AI
Published: 2025-06-07 11:20:47
License: 暂无描述

Hugging Face2025-06-07 更新2025-06-08 收录

下载链接：

https://huggingface.co/datasets/allenai/SimpleToM-rich

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了四种类型的问题和故事相关的数据：行为问题回答（behavior-qa）、判断问题回答（judgment-qa）、心理状态问题回答（mental-state-qa）和故事数据（story-data）。每种类型的数据都包含了故事文本、问题、选项和答案等信息。故事数据还包含了关于故事严重性、危害性和不道德性的预测信息。

提供机构：

Allen Institute for AI

创建时间：

2025-06-07

搜集汇总

数据集介绍

构建方式

在心理理论评估领域，SimpleToM-rich数据集通过结构化故事生成与多维度标注构建而成。研究者采用人工编写与模型生成相结合的方式，创建了包含丰富社会情境的叙事文本，每个故事均标注了实体关系、行为序列和心理状态变化。数据集进一步通过专业标注团队对道德判断、伤害性预测等维度进行精细化标注，确保数据具有高度的语义复杂性和逻辑一致性。

特点

该数据集的核心特征体现在其多模态评估框架与细粒度标注体系。包含行为判断、心理状态推理和道德评价三大任务模块，每个故事均配有实体映射、关键信息提取及问题-答案对。数据集特别引入了伤害性和非道德性预测指标，并采用多模型标注验证机制，为心理理论计算模型提供兼具广度与深度的评估基准。

使用方法

研究者可通过加载不同配置模块分别访问行为问答、判断问答和心理状态问答子集。使用时应首先解析故事文本与关联的元数据，继而利用提供的问题-答案对进行模型训练或评估。对于高级应用，可结合故事富文本版本与预测指标数据，开展多维度心理理论能力分析，建议采用分层加载策略以优化内存使用效率。

背景与挑战

背景概述

SimpleToM-rich数据集诞生于人工智能理论心智研究的关键发展阶段，由前沿学术机构于2023年推出，旨在深化机器对人类心理状态的理解能力。该数据集通过构建多维度社会情境叙事，聚焦于心理状态推理、行为动机判断及道德伦理评估等核心认知科学问题，为推进具有人类式心理理论的人工智能系统提供了重要实验基准，显著促进了认知计算与伦理人工智能的跨学科融合。

当前挑战

数据集需解决心理状态动态建模的复杂性挑战，包括多层级意图推理、情感因果关联解构以及道德判断的语境依赖性。构建过程中面临叙事逻辑一致性维护、多模态心理标注体系建立，以及跨文化伦理价值观标准化等难题，同时需确保生成文本的语义深度与标注者主观判断间的平衡。

常用场景

经典使用场景

在心理理论研究中，SimpleToM-rich数据集通过精心设计的叙事场景和问答对，为评估计算模型的心理状态推理能力提供了标准化的测试平台。该数据集包含行为判断、道德评价和心理状态推断等多维度任务，能够系统检验模型对故事角色信念、意图和情感的理解深度，成为认知计算领域的重要基准工具。

实际应用

在人工智能伦理评估和人机交互系统设计中，SimpleToM-rich数据集可作为核心测试工具用于验证社交机器人的心理推理能力。其丰富的叙事场景能够模拟真实社交情境，帮助开发更符合人类认知模式的对话系统，在心理健康辅助诊断、教育机器人情感交互等领域具有重要应用价值。

衍生相关工作

基于该数据集衍生的研究显著推进了心理理论计算建模的发展，催生了诸如ToMNet、心理状态预测网络等创新架构。这些工作通过结合神经网络与符号推理，在多层次心理状态建模方面取得突破，为构建具有社会认知能力的智能体奠定了理论基础，并促进了认知科学与人工智能的深度交叉。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集