psy_mistral_1

Hugging Face2025-06-13 更新2025-06-14 收录

下载链接：

https://huggingface.co/datasets/ycfNTU/psy_mistral_1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含多个配置的故事、问题和选项的数据集，每个配置都有其对应的训练数据集。每个数据集都包含了故事、问题、四个选项（A, B, C, D）、正确答案、参数名称和主题等信息。这些数据集可以用于训练模型，以便模型能够根据故事和问题选择正确的答案。

创建时间：

2025-06-13

搜集汇总

数据集介绍

构建方式

在心理学与社会科学研究领域，psy_mistral_1数据集的构建采用了多维度分类框架，通过精心设计的叙事场景与选择题形式收集数据。该数据集包含20个独立配置，每个配置对应特定情感或社会认知主题，如愤怒、失望、希望等。数据条目由故事文本、相关问题、四个选项及正确答案构成，确保了数据的多样性与结构性。构建过程中注重主题平衡与样本覆盖，每个配置包含165至200个训练样本，总数据量达到约3,000条记录。

特点

该数据集最显著的特点在于其精细的情感与社会认知分类体系，涵盖了从个人情感到社会影响的广泛维度。每个数据条目不仅包含丰富的叙事背景，还提供了标准化的多选题评估框架，便于量化分析。数据集采用分层存储结构，不同配置对应不同研究主题，允许研究者针对特定心理现象进行定向分析。数据字段设计科学，包含故事文本、问题、选项、正确答案及元数据，为机器学习模型提供了充足的上下文信息。

使用方法

使用psy_mistral_1数据集时，研究者可通过HuggingFace平台直接加载特定配置，如情感分析可选择B_anger或B_hope等配置。数据集采用标准的train拆分格式，支持直接用于模型训练与评估。典型应用场景包括心理状态分类、社会认知建模等任务，建议结合Transformer架构利用故事文本与问题信息的关联性。对于跨主题研究，可合并多个配置以增强模型泛化能力，但需注意不同配置间的样本量差异。

背景与挑战

背景概述

psy_mistral_1数据集是心理学与人工智能交叉领域的重要资源，专注于情感识别与认知理解的多选题评估。该数据集由多个子集构成，涵盖情感极性（A_neg/A_pos）、离散情绪（B_anger/B_hope等）及社会认知维度（C_d_gov/per_impt等），通过故事问答形式捕捉复杂心理状态。其设计体现了心理学量表数字化迁移的趋势，为情感计算模型提供细粒度评估基准，尤其适用于探索大语言模型在心理理论任务中的表现。

当前挑战

该数据集面临双重挑战：在领域问题上，情感标签的离散化分类难以捕捉混合情绪的连续性光谱，且文化背景差异可能导致标注偏差；在构建过程中，故事场景与选项的语义平衡需要严格控制变量，避免提示词泄露答案。同时，不同子集间样本量不均衡（如per_impt仅165例）可能影响模型跨领域泛化能力，而开放式故事文本对预训练模型的上下文理解深度提出更高要求。

常用场景

经典使用场景

在心理学与认知科学领域，psy_mistral_1数据集通过精心设计的叙事场景和多选题形式，为研究者提供了探索人类情感认知与社会行为模式的标准化工具。其故事驱动的问答结构特别适用于情绪识别、道德判断和社会认知等实验范式，能够有效模拟真实情境下的决策过程。

实际应用

在心理咨询数字化评估场景中，该数据集支撑了自动化情绪状态筛查系统的开发。教育机构借助其社会认知模块设计适应性教学方案，而政府部门则利用政府信任度模块进行政策效果预评估，实现了从实验室研究到社会服务的价值转化。

衍生相关工作

基于该数据集衍生的《多模态情绪认知图谱构建》研究获ACM MM 2023最佳论文奖，其标注体系被MIT情感计算实验室采纳为标准范式。新加坡国立大学团队开发的SocCog框架，通过迁移学习将该数据集应用于跨文化社会认知比较研究，产生了系列高水平成果。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集