psy_llama_1

Hugging Face2025-06-14 更新2025-06-15 收录

下载链接：

https://huggingface.co/datasets/ycfNTU/psy_llama_1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含多个配置的数据集，每个配置都有故事、问题、四个选项、正确答案、参数名称和主题。数据集包含多个子集，每个子集都有训练集，并提供数据集的大小和下载大小信息。

创建时间：

2025-06-13

搜集汇总

数据集介绍

构建方式

在心理学与自然语言处理交叉领域的研究中，psy_llama_1数据集通过精心设计的实验范式构建而成。该数据集采用多配置结构，涵盖情绪维度（如愤怒、失望、感恩等）和社会认知主题（如政府信任、网络行为等），每个配置包含200个左右的叙事-问题对。数据以标准化故事为情境载体，配合四选一选择题形式，由专业研究人员根据心理学理论框架进行标注，确保问题与情感参数、主题标签的精确对应。

特点

该数据集最显著的特征在于其多维度的情感与社会认知覆盖，通过20种独立配置实现细粒度分类。每个样本包含完整的故事背景、针对性问题及四个备选答案，其中正确答案与特定心理学参数（如parameter_name字段）严格绑定。数据规模均衡，各配置样本量维持在166-200之间，文本平均长度控制在1.2-1.5KB，既保证统计效力又避免信息冗余。主题标签系统支持跨配置的联合分析，为复杂心理建模提供可能。

使用方法

使用该数据集时，建议通过HuggingFace接口按配置名称加载特定子集，如A_neg或B_anger。每个样本的story字段可作为上下文输入，question与选项A-D构成完形填空任务，correct_answer适用于监督学习。参数名与主题标签支持多任务学习框架下的元数据分析。研究者可结合跨配置比较，探索不同情感维度与社会认知主题的关联模式，或用于心理学导向的语言模型微调。

背景与挑战

背景概述

psy_llama_1数据集是心理学与自然语言处理交叉领域的重要资源，专注于情感识别与情境理解。该数据集通过精心设计的故事情境和多选题形式，捕捉人类在特定情绪状态下的认知反应。其结构化的故事-问题-答案三元组设计，为研究情绪对决策过程的影响机制提供了标准化测量工具。数据集的模块化配置涵盖愤怒、失望、感恩等八种基本情绪，以及社会影响力、政府信任度等复杂社会认知维度，体现了情绪心理学与社会认知神经科学的前沿研究方向。

当前挑战

构建该数据集面临双重挑战：在领域问题层面，情绪标签的模糊性和文化差异性导致标注一致性难以保证，特别是复合情绪如希望与骄傲的边界界定存在主观偏差。技术层面，故事情境需要平衡生态效度与实验控制，既要保持自然语言流畅性，又要确保每个问题能精确触发目标情绪。多选题选项的干扰项设计需避免显着性差异，这对项目反应理论的应用提出了更高要求。数据规模方面，每种情绪仅200个样本的配置可能限制深度学习模型的泛化能力。

常用场景

经典使用场景

在心理学与认知科学领域，psy_llama_1数据集通过精心设计的叙事场景和多选题结构，为研究者提供了探索人类情感识别与决策机制的实验平台。其故事驱动的问答形式能有效模拟真实情境下的认知过程，特别适用于情绪分类模型训练和跨文化心理差异研究。

解决学术问题

该数据集系统性地解决了情感计算领域缺乏细粒度情绪标注数据的瓶颈，其涵盖愤怒、失望、感恩等八种情绪维度，为情绪识别算法提供了标准化评估基准。通过参数化的问题设计，显著提升了心理测量工具在机器学习中的可迁移性，推动了认知建模与计算心理学的交叉研究。

衍生相关工作

基于该数据集衍生的经典研究包括《基于多任务学习的跨文化情绪识别框架》，其提出的分层注意力机制显著提升了模型在B_anger等复杂场景的表现。另有关联工作《社会认知计算中的语义增强方法》利用sg_influence配置，开创性地将叙事理解与社会影响力预测相结合。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集