TomDatasets

Hugging Face2026-03-28 更新2026-03-29 收录

下载链接：

https://huggingface.co/datasets/TomTraining/TomDatasets

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个关于 Theory of Mind（心智理论）的数据集集合，旨在支持问答任务。心智理论指的是理解他人拥有与自己不同的想法、信念、情绪和意图的能力。数据集使用英语，采用 Apache-2.0 许可证发布。

创建时间：

2026-03-27

搜集汇总

数据集介绍

构建方式

在认知科学领域，心智理论（Theory of Mind, ToM）数据集旨在系统化地评估模型对人类心理状态的理解能力。该数据集通过整合多源实验范式与自然语言处理任务，构建了一个涵盖问答形式的集合。其构建过程注重从心理学经典实验与日常对话场景中提取素材，确保数据既具备理论深度又贴近实际交互，从而为模型提供结构化的心智推理测试环境。

特点

该数据集的核心特点在于其专注于心智理论的多维度评估，覆盖信念、情绪、意图等关键心理状态。数据以英语呈现，采用问答任务形式，强调对他人心理与自我差异的区分。其设计兼顾了实验控制与生态效度，既包含精心设计的理论场景，也融入了自然语言中的隐含推理，为模型提供了从基础到复杂的渐进式挑战。

使用方法

使用该数据集时，研究者可将其应用于问答模型的训练与评估，以检验模型的心智推理能力。建议按照标准自然语言处理流程进行数据加载与预处理，并依据任务设计相应的评估指标，如准确率或F1分数。该数据集适用于对比不同模型在心理状态理解上的表现，也可作为增强模型社会认知能力的辅助资源，推动人工智能向更人性化的交互方向发展。

背景与挑战

背景概述

心智理论作为认知科学和人工智能交叉领域的关键议题，旨在探究个体如何推断他人心理状态的能力。TomDatasets由研究团队于近年构建，聚焦于通过问答任务形式，系统评估计算模型对人类信念、意图及情绪的理解水平。该数据集推动了自然语言处理在社交推理方面的发展，为构建具备人类般社会智能的AI系统提供了重要基准。

当前挑战

心智理论评估本身面临深层语义理解与上下文推理的复杂性，要求模型超越表面语言模式，把握隐含心理状态。在数据构建过程中，需克服人工标注中主观偏差的干扰，确保场景设计的多样性与文化中立性，同时平衡数据规模与标注质量间的张力，以真实反映人类社交认知的微妙维度。

常用场景

经典使用场景

在认知科学和人工智能领域，Theory of Mind（心智理论）数据集TomDatasets为研究者提供了评估模型理解他人心理状态能力的基准。该数据集通过精心设计的问答任务，模拟了人类在日常互动中推断他人信念、意图和情绪的情境，成为测试机器是否具备类似人类社会认知功能的核心工具。其典型应用场景包括自然语言处理中的对话系统评估，以及心理学实验中计算模型的验证，为跨学科研究搭建了桥梁。

实际应用

在实际应用中，TomDatasets被广泛集成于智能助手、教育机器人和临床诊断工具的开发中。例如，在自闭症干预领域，基于该数据集训练的模型能够辅助识别患者在社交互动中的心理状态理解缺陷，从而提供个性化支持。同时，在客户服务自动化场景下，具备心智理论能力的对话系统可以更准确地解读用户意图，提升人机交互的自然性和效率，体现了从理论研究到社会服务的价值转化。

衍生相关工作

围绕TomDatasets，学术界衍生了一系列经典研究工作，包括基于Transformer的预训练模型（如BERT和GPT变体）在心智理论任务上的微调与评估。这些工作不仅验证了大规模语言模型的社会推理潜力，还催生了新的评估框架，如ToM-Bench和SocialIQa，进一步扩展了数据集的覆盖范围。此外，跨模态研究将视觉与文本数据结合，探索了多模态心智理论建模，推动了认知人工智能向更全面、更人性化的方向发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集