T4D

github2024-09-26 更新2024-10-04 收录

下载链接：

https://github.com/sachith-gunasekara/t4d

下载链接

链接失效反馈

官方服务：

资源简介：

T4D数据集是从ToMi数据集转换而来的，专注于处理具有理论心理（Theory of Mind）问题的示例，特别是涉及二阶错误信念的问题。

The T4D dataset, derived from the ToMi dataset, focuses on examples involving Theory of Mind tasks, particularly those related to second-order false beliefs.

创建时间：

2024-09-24

原始信息汇总

T4D 数据集概述

项目描述

T4D 数据集是从 ToMi 数据集转换而来的，引入了论文 https://arxiv.org/abs/2310.03051 中提出的算法。该数据集过滤了 ToMi 数据集中包含 Theory of Mind (ToM) 问题的示例，并针对具有二阶错误信念的问题进行了算法调整。

使用方法

该项目以静态方式构建，用于将预定义的 ToMi 数据集（位于 t4d/data/ 文件夹中）转换为 T4D 数据集，转换后的数据集也存储在同一文件夹中。

安装与运行

bash git clone https://github.com/sachith-gunasekara/t4d # 克隆仓库 cd t4d # 进入项目目录 poetry install # 安装依赖（可以选择配置虚拟环境或让 poetry 自动创建环境） python -m spacy download en_core_web_trf # 用于命名实体识别（NER） python t4d/main.py # 运行主程序

许可证

该项目基于 Apache License 2.0 版本进行授权。

搜集汇总

数据集介绍

构建方式

T4D数据集的构建基于ToMi数据集的转换算法，通过筛选ToMi数据集中包含Theory of Mind问题的示例，并对其进行适度的算法调整，以处理涉及二阶错误信念的问题。此过程确保了数据集的多样性和复杂性，同时保留了原始数据集的核心特征。

特点

T4D数据集的一个显著特点是其对二阶错误信念问题的处理能力，这使得该数据集在研究高级认知功能方面具有独特优势。此外，数据集的静态构建方式确保了其一致性和可重复性，为研究者提供了可靠的数据基础。

使用方法

使用T4D数据集时，研究者首先需克隆GitHub仓库并安装相关依赖。通过运行主脚本，数据集将自动从ToMi转换为T4D格式，并存储在指定文件夹中。此过程简化了数据处理流程，便于研究者快速获取和分析数据。

背景与挑战

背景概述

T4D数据集，全称为Thinking is for Doing，是由Sachith Gunasekara等人基于ToMi数据集开发的。该数据集的核心研究问题围绕Theory of Mind（ToM），即心智理论，旨在通过转换算法从ToMi数据集中筛选出包含ToM问题的样本，以生成新的T4D数据集。这一研究不仅深化了对心智理论的理解，还为相关领域的研究提供了新的数据资源。T4D数据集的创建标志着在心智理论研究领域的一次重要进展，其影响力在于为后续研究提供了更为精确和多样化的数据支持。

当前挑战

T4D数据集在构建过程中面临的主要挑战包括：首先，从ToMi数据集中筛选出符合ToM问题的样本需要精确的算法调整，特别是处理包含二阶错误信念的问题。其次，尽管原始论文声称可以筛选出约500个样本，实际操作中发现这一标准并不完全适用，导致数据集的规模和质量控制成为一大难题。此外，数据集的静态构建方式限制了其灵活性和扩展性，未来研究可能需要探索更为动态和可扩展的数据集构建方法。

常用场景

经典使用场景

在认知科学领域，T4D数据集的经典使用场景主要集中在理论心理学的研究中。该数据集通过从ToMi数据集中筛选出包含理论心理（ToM）问题的示例，特别是那些涉及二阶错误信念的问题，为研究者提供了一个独特的数据资源。这些数据不仅有助于深入理解人类心理活动的复杂性，还为开发和验证心理模型提供了宝贵的实验材料。

衍生相关工作

T4D数据集的发布催生了一系列相关研究工作。例如，有研究者基于该数据集开发了新的心理模型，以更精确地预测和解释人类行为。同时，也有学者利用T4D数据集进行跨学科研究，探索心理学与人工智能的结合点。此外，该数据集还激发了关于数据集构建和筛选方法的讨论，推动了数据科学方法论的发展。

数据集最近研究