ToM-in-AMC

Hugging Face2025-03-29 更新2025-03-30 收录

下载链接：

https://huggingface.co/datasets/ShunchiZhang/ToM-in-AMC

下载链接

链接失效反馈

官方服务：

资源简介：

ToM-in-AMC数据集包含了约1000个来自IMSDb的电影剧本解析，每个剧本对应一个角色理解任务。

创建时间：

2025-03-29

搜集汇总

数据集介绍

构建方式

在认知科学和自然语言处理交叉领域，ToM-in-AMC数据集的构建采用了严谨的多阶段方法论。研究团队从IMSDb电影剧本库中精选约1,000部剧本进行结构化解析，通过专家标注构建了角色心理理解任务框架。数据采集过程注重剧本场景的多样性和角色互动的复杂性，采用分布式标注系统确保标注质量，最终形成包含训练集、开发集和测试集的标准化评估体系，并特别设置人工验证子集以保证数据可靠性。

特点

该数据集在心理理论评估领域展现出独特的范式特征。其核心价值在于将电影剧本中丰富的角色互动转化为可量化的认知任务，包含超过10万条经过精细标注的多选题样本。数据分布涵盖不同电影类型和叙事风格，每个样本都封装了角色意图推断、信念识别等心理状态理解维度。特别设计的dev_human_subset和test_human_subset为模型性能提供了人类基准参照，使该数据集成为评估机器心理理论能力的黄金标准。

使用方法

研究者可通过HuggingFace平台直接加载parquet格式的分割数据集，标准化的数据结构包含训练集、开发集和测试集三个主要分割。使用建议遵循渐进式评估策略：先在常规开发集进行模型调参，再通过人工验证子集检验泛化能力。数据集的多元选择题格式支持端到端的心理理论能力测评，配套的评估脚本和基线模型代码库为复现论文结果提供了完整的技术支持。

背景与挑战

背景概述

ToM-in-AMC数据集由腾讯等机构的研究团队于2024年构建，旨在探索电影角色心理理论（Theory of Mind, ToM）的元学习评估。该数据集基于IMSDb的约1,000部电影剧本解析，聚焦于角色理解任务，为认知科学和人工智能交叉领域提供了新颖的研究素材。作为ICML 2024会议成果，其创新性地将电影叙事作为心理状态推理的复杂场景，推动了社会认知计算模型的发展，对自然语言处理中的心智化能力测评具有里程碑意义。

当前挑战

该数据集面临双重挑战：在领域问题层面，电影角色心理状态的隐含性和多义性要求模型具备深层语义推理能力，传统文本分类方法难以捕捉非显式表达的社会认知线索；在构建过程中，剧本数据的非结构化特性导致角色行为与心理状态标注困难，研究团队需设计精细的标注框架以平衡主观判断与客观事实。此外，跨电影风格差异带来的领域适应问题，以及小样本场景下的元学习有效性验证，均为该数据集的核心技术难点。

常用场景

经典使用场景

在认知科学与人工智能交叉领域，ToM-in-AMC数据集通过解析约1000部电影剧本，构建了角色心理理解任务的标准化评估框架。该数据集最经典的应用场景在于测试机器学习模型对电影角色动机、信念和意图的推理能力，尤其在元学习范式中验证模型是否具备类似人类的心智理论能力。

实际应用

在影视内容智能分析领域，该数据集支持开发能理解角色心理状态的AI系统，应用于剧本自动分析、角色关系图谱构建等场景。其标注框架为构建具有社会认知能力的对话系统提供了训练范式，在个性化推荐、虚拟角色交互等产业应用中展现出潜在价值。

衍生相关工作

基于该数据集衍生的经典研究包括跨模态心智理论建模、叙事理解中的元学习框架等。相关成果发表在ICML等顶级会议，推动了社会推理神经网络架构的发展，并为认知科学中的计算建模提供了新的实验范式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集