Psych-101

Hugging Face2024-11-03 更新2024-12-12 收录

心理学

认知模型

数据链接：

https://huggingface.co/datasets/marcelbinz/Psych-101 数据链接链接失效反馈

官方服务：

资源简介：

Psych-101数据集是一个自然语言转录的心理学实验数据集，包含了160个心理学实验的逐次数据，涉及60,092名参与者，共记录了10,681,650次选择。数据集中的选择信息被封装在“<<”和“>>”标记中。数据集的主要用途是研究人类认知的基础模型。数据集提供了详细的实验文本、实验标识符和参与者标识符。数据集的语言为英语，使用Apache 2.0许可证。

The Psych-101 dataset is a natural language-transcribed psychological experiment dataset, containing trial-by-trial data from 160 psychological experiments, involving 60,092 participants and a total of 10,681,650 recorded choices. Choice information within the dataset is enclosed within "<<" and ">>" delimiters. The primary purpose of this dataset is to study foundational models of human cognition. The dataset provides detailed experimental texts, experiment identifiers, and participant identifiers. The dataset is in English and is licensed under the Apache 2.0 License.

创建时间：

2024-10-23

原始信息汇总

Psych-101 数据集概述

数据集摘要

Psych-101 是一个自然语言转录数据集，来源于人类心理学实验。该数据集包含160个心理学实验的逐次数据，涉及60,092名参与者，共计10,681,650次选择。人类选择以“<<”和“>>”标记。

示例提示

你将看到三组对象，分别标记为D、P和H。在每次试验中，请通过按下相应的键来指出你认为最不相似的对象。换句话说，请选择与其他两个对象最不相似的那个。

D: 馅饼皮, P: 游戏, H: 手镯。你按下 <<D>>。 D: 音叉, P: 火箭, H: 华夫饼机。你按下 <<P>>。 D: 粗粒, P: 组合锁, H: 手提箱。你按下 <<D>>。 D: 巨石, P: 里程表, H: 萨拉米香肠。你按下 <<P>>。 D: 勺子, P: 尿布, H: 卫星天线。你按下 <<P>>。 [...]

语言

英语。

使用方法

python from datasets import load_dataset data = load_dataset(marcelbinz/Psych-101)

数据字段

json { "text": 实验的自然语言转录, "experiment": 实验标识符, "participant": 参与者标识符 }

许可信息

Apache License 2.0

引用信息

bibtex @misc{binz2024centaurfoundationmodelhuman, title={Centaur: a foundation model of human cognition}, author={Marcel Binz and Elif Akata and Matthias Bethge and Franziska Brändle and Fred Callaway and Julian Coda-Forno and Peter Dayan and Can Demircan and Maria K. Eckstein and Noémi Éltető and Thomas L. Griffiths and Susanne Haridi and Akshay K. Jagadish and Li Ji-An and Alexander Kipnis and Sreejan Kumar and Tobias Ludwig and Marvin Mathony and Marcelo Mattar and Alireza Modirshanechi and Surabhi S. Nath and Joshua C. Peterson and Milena Rmus and Evan M. Russek and Tankred Saanum and Natalia Scharfenberg and Johannes A. Schubert and Luca M. Schulze Buschoff and Nishad Singhi and Xin Sui and Mirko Thalmann and Fabian Theis and Vuong Truong and Vishaal Udandarao and Konstantinos Voudouris and Robert Wilson and Kristin Witte and Shuchen Wu and Dirk Wulff and Huadong Xiong and Eric Schulz}, year={2024}, eprint={2410.20268}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2410.20268}, }

搜集汇总

数据集介绍

构建方式

Psych-101数据集构建基于160项心理学实验的自然语言转录数据，涵盖了60,092名参与者的10,681,650次选择。数据通过实验中的逐项记录生成，参与者的选择被封装在特定的标记符号中，确保了数据的完整性和可追溯性。

特点

该数据集的特点在于其广泛覆盖了心理学实验的多样性，提供了丰富的自然语言转录数据。每个实验和参与者的选择均被详细记录，且数据以结构化的形式呈现，便于研究者进行深入分析。此外，数据集中的选择行为通过特定标记符号进行标注，增强了数据的可读性和可解释性。

使用方法

使用Psych-101数据集时，研究者可通过`datasets`库中的`load_dataset`函数直接加载数据。数据集包含三个主要字段：实验的自然语言转录文本、实验标识符以及参与者标识符。通过分析这些字段，研究者可以深入探讨人类认知行为及其背后的心理学机制。

背景与挑战

背景概述

Psych-101数据集由Marcel Binz等研究人员于2024年发布，旨在为心理学实验提供自然语言转录数据。该数据集涵盖了160项心理学实验，涉及60,092名参与者，共计10,681,650次选择。其核心研究问题在于通过大规模实验数据，探索人类认知行为的基本模式，并为构建人类认知的基础模型提供支持。该数据集与《Centaur: a foundation model of human cognition》论文密切相关，为心理学与人工智能的交叉研究提供了重要资源，推动了认知科学领域的发展。

当前挑战

Psych-101数据集在解决心理学实验数据的标准化与大规模分析方面面临显著挑战。首先，心理学实验的多样性与复杂性使得数据标注与整合成为难题，需要确保实验设计的统一性与数据的可解释性。其次，自然语言转录的准确性要求极高，需避免语义偏差与信息丢失。此外，数据集的构建过程中，如何平衡参与者隐私保护与数据开放共享也是一个关键问题。这些挑战不仅影响了数据集的可用性，也对后续研究提出了更高的技术要求。

常用场景

经典使用场景

在心理学研究中，Psych-101数据集被广泛应用于分析人类决策行为。通过包含160项心理学实验的逐次试验数据，研究者能够深入探讨人类在面对复杂选择时的认知机制。该数据集为心理学实验提供了丰富的自然语言转录，使得研究者能够在实验室环境之外，模拟真实世界中的决策场景。

实际应用

在实际应用中，Psych-101数据集被用于开发智能系统，以模拟人类的决策过程。例如，在人工智能领域，该数据集可用于训练模型，使其能够更好地理解和预测人类行为。此外，该数据集还可用于教育领域，帮助学生和研究者通过分析实验数据，深入理解心理学中的决策理论。

衍生相关工作

基于Psych-101数据集，研究者们开展了多项经典工作。例如，Marcel Binz等人提出的Centaur模型，利用该数据集构建了一个人类认知的基础模型。该模型不仅在心理学领域产生了广泛影响，还为人工智能的发展提供了新的思路。此外，该数据集还激发了多项关于人类决策行为的研究，推动了认知科学和人工智能的交叉融合。

以上内容由遇见数据集搜集并总结生成

Psych-101

资源简介：

Psych-101 数据集概述

数据集摘要

示例提示

语言

使用方法

数据字段

许可信息

引用信息

相关数据集