llama_psy2
收藏Hugging Face2025-06-11 更新2025-06-12 收录
下载链接:
https://huggingface.co/datasets/ycfNTU/llama_psy2
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含多个配置的数据集,每个配置都有其独特的特性和数据文件。数据集中的特性包括故事、问题、选项A、选项B、选项C、选项D、正确答案、参数名称和主题。每个配置都有一个唯一的配置名称,并且数据被分割成训练数据。数据集被组织成不同的类别,如A_neg、A_pos、B_anger、B_disap、B_fear、B_grat、B_hope、B_pride、C_a_gov、C_a_net、C_a_soc、C_d_col、C_d_gov、C_d_nat、C_d_net、C_d_pol、C_d_soc、per_connectsg、per_impt、per_posneg、per_turnpt、sg_connectsg、sg_impt、sg_influence、sg_posneg和sg_turnpt。每个类别都有自己的训练数据和相关的文件。
创建时间:
2025-06-10
原始信息汇总
数据集概述
基本信息
- 数据集名称: llama_psy2
- 数据集地址: https://huggingface.co/datasets/ycfNTU/llama_psy2
数据集结构
- 配置数量: 30个
- 每个配置的样本数: 200个
- 总样本数: 6000个
数据特征
所有配置包含相同的特征:
story: 字符串类型,故事内容question: 字符串类型,问题内容A: 字符串类型,选项AB: 字符串类型,选项BC: 字符串类型,选项CD: 字符串类型,选项Dcorrect_answer: 字符串类型,正确答案parameter_name: 字符串类型,参数名称topic: 字符串类型,主题
配置列表
-
A_neg
- 训练集大小: 247061字节
- 下载大小: 141651字节
-
A_pos
- 训练集大小: 249210字节
- 下载大小: 138405字节
-
B_anger
- 训练集大小: 222368字节
- 下载大小: 126719字节
-
B_disap
- 训练集大小: 236938字节
- 下载大小: 127044字节
-
B_fear
- 训练集大小: 224873字节
- 下载大小: 118753字节
-
B_grat
- 训练集大小: 257876字节
- 下载大小: 141712字节
-
B_hope
- 训练集大小: 276126字节
- 下载大小: 153304字节
-
B_pride
- 训练集大小: 246154字节
- 下载大小: 131380字节
-
C_a_col
- 训练集大小: 251109字节
- 下载大小: 138869字节
-
C_a_gov
- 训练集大小: 248444字节
- 下载大小: 132955字节
-
C_a_nat
- 训练集大小: 245871字节
- 下载大小: 135379字节
-
C_a_net
- 训练集大小: 249835字节
- 下载大小: 130853字节
-
C_a_pol
- 训练集大小: 245113字节
- 下载大小: 132203字节
-
C_a_soc
- 训练集大小: 247178字节
- 下载大小: 136242字节
-
C_d_col
- 训练集大小: 257999字节
- 下载大小: 131183字节
-
C_d_gov
- 训练集大小: 250742字节
- 下载大小: 129787字节
-
C_d_nat
- 训练集大小: 245297字节
- 下载大小: 125741字节
-
C_d_net
- 训练集大小: 241682字节
- 下载大小: 126006字节
-
C_d_pol
- 训练集大小: 250009字节
- 下载大小: 127263字节
-
C_d_soc
- 训练集大小: 244474字节
- 下载大小: 128764字节
-
C_p_net
- 训练集大小: 253949字节
- 下载大小: 135232字节
-
C_p_soc
- 训练集大小: 250976字节
- 下载大小: 136682字节
-
per_connectsg
- 训练集大小: 256283字节
- 下载大小: 131503字节
-
per_impt
- 训练集大小: 271351字节
- 下载大小: 147120字节
-
per_posneg
- 训练集大小: 238664字节
- 下载大小: 131590字节
-
per_turnpt
- 训练集大小: 273511字节
- 下载大小: 148519字节
-
sg_connectsg
- 训练集大小: 260746字节
- 下载大小: 133518字节
-
sg_impt
- 训练集大小: 276827字节
- 下载大小: 152428字节
-
sg_influence
- 训练集大小: 260870字节
- 下载大小: 131343字节
-
sg_turnpt
- 训练集大小: 297731字节
- 下载大小: 155672字节
搜集汇总
数据集介绍

构建方式
llama_psy2数据集通过精心设计的心理评估框架构建,包含多个配置模块,每个模块聚焦于特定的情感或社会认知维度。数据采集过程采用标准化故事叙述与多选题结合的范式,确保每项记录包含完整的故事背景、相关问题、四个备选答案及正确答案。数据集按情感极性(如A_pos/A_neg)、基本情绪类型(如B_anger/B_hope)和社会认知主题(如C_a_pol/C_d_soc)进行系统分类,形成层次化的知识结构体系。
特点
该数据集最显著的特点是具有精细的情感与认知维度划分,涵盖从基础情绪到复杂社会认知的28个独立配置模块。每个模块包含200个训练样本,通过故事叙述与选择题的有机结合,既保留了语境信息又具备明确的评估标准。参数名称(parameter_name)和主题标签(topic)的双重标注体系,为研究情感计算与社会认知建模提供了多维度的分析视角。数据规模均衡性良好,单个模块体积控制在250KB左右,兼顾了数据深度与处理效率。
使用方法
使用该数据集时,建议根据研究目标选择相应的配置模块进行针对性分析。通过HuggingFace平台可直接加载特定模块(如B_anger或C_d_soc)的训练集,每个样本包含故事文本、问题及选项的完整上下文。对于情感计算研究,可重点利用A/B类模块的情绪标注;社会认知分析则宜采用C类及sg/per前缀的模块。数据集的标准化结构支持端到端的模型训练,也可通过parameter_name字段实现跨模块的对比研究。
背景与挑战
背景概述
llama_psy2数据集是一个专注于心理学领域的数据集,旨在通过故事和多项选择题的形式评估个体在不同情境下的心理反应和决策过程。该数据集由多个配置组成,涵盖了情绪、社会认知、政治态度等多个心理学维度。通过精心设计的题目和情境,该数据集为心理学研究提供了丰富的实证材料,有助于深入理解人类行为背后的心理机制。其多维度、多情境的设计使得该数据集在心理学、认知科学和行为科学等领域具有广泛的应用潜力。
当前挑战
llama_psy2数据集面临的挑战主要包括两个方面:首先,心理学领域的复杂性和主观性使得数据标注和验证过程极具挑战性,需要依赖专业的心理学知识以确保数据的准确性和可靠性;其次,数据集的构建过程中需要平衡不同情境和维度的覆盖范围,以确保数据的多样性和代表性,这对数据收集和整理工作提出了较高的要求。此外,如何确保不同配置之间的数据一致性和可比性,也是该数据集在实际应用中需要解决的关键问题。
常用场景
经典使用场景
在心理学与认知科学领域,llama_psy2数据集以其丰富的故事背景和多选题形式,为研究者提供了探索人类情感认知与社会行为机制的理想实验材料。通过分析受试者对故事情境中情绪反应(如愤怒、失望、感恩等)的选择模式,该数据集能够揭示情感识别与决策过程中的认知偏差与规律。
衍生相关工作
基于该数据集的情感标注体系,后续研究衍生出跨文化情绪识别比较框架,如对比B_grat与B_pride配置的东方集体主义与西方个人主义表达差异。在可解释AI方向,per_turnpt配置启发了决策过程可视化研究,通过追踪选项切换节点揭示人类道德判断的认知轨迹。
数据集最近研究
最新研究方向
在心理学与自然语言处理的交叉领域,llama_psy2数据集以其丰富的情绪和情境分类特征,成为研究情感计算与认知建模的重要资源。该数据集通过故事问答形式捕捉多元情感维度,包括愤怒、失望、恐惧等负面情绪,以及感恩、希望等正面情绪,为情感识别算法的细粒度优化提供了实验基础。近期研究聚焦于利用其多层次标注结构开发跨领域情感迁移学习框架,特别是在社会舆情分析和心理状态预测等应用场景中展现出独特价值。随着大语言模型在心理辅助工具中的广泛应用,该数据集正推动基于认知科学的可解释AI研究,为解决情绪理解中的语境依赖性难题提供了新的数据范式。
以上内容由遇见数据集搜集并总结生成



