psy_mistral_1
收藏Hugging Face2025-06-13 更新2025-06-14 收录
下载链接:
https://huggingface.co/datasets/ycfNTU/psy_mistral_1
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含多个配置的故事、问题和选项的数据集,每个配置都有其对应的训练数据集。每个数据集都包含了故事、问题、四个选项(A, B, C, D)、正确答案、参数名称和主题等信息。这些数据集可以用于训练模型,以便模型能够根据故事和问题选择正确的答案。
创建时间:
2025-06-13
搜集汇总
数据集介绍

构建方式
在心理学与社会科学研究领域,psy_mistral_1数据集的构建采用了多维度分类框架,通过精心设计的叙事场景与选择题形式收集数据。该数据集包含20个独立配置,每个配置对应特定情感或社会认知主题,如愤怒、失望、希望等。数据条目由故事文本、相关问题、四个选项及正确答案构成,确保了数据的多样性与结构性。构建过程中注重主题平衡与样本覆盖,每个配置包含165至200个训练样本,总数据量达到约3,000条记录。
特点
该数据集最显著的特点在于其精细的情感与社会认知分类体系,涵盖了从个人情感到社会影响的广泛维度。每个数据条目不仅包含丰富的叙事背景,还提供了标准化的多选题评估框架,便于量化分析。数据集采用分层存储结构,不同配置对应不同研究主题,允许研究者针对特定心理现象进行定向分析。数据字段设计科学,包含故事文本、问题、选项、正确答案及元数据,为机器学习模型提供了充足的上下文信息。
使用方法
使用psy_mistral_1数据集时,研究者可通过HuggingFace平台直接加载特定配置,如情感分析可选择B_anger或B_hope等配置。数据集采用标准的train拆分格式,支持直接用于模型训练与评估。典型应用场景包括心理状态分类、社会认知建模等任务,建议结合Transformer架构利用故事文本与问题信息的关联性。对于跨主题研究,可合并多个配置以增强模型泛化能力,但需注意不同配置间的样本量差异。
背景与挑战
背景概述
psy_mistral_1数据集是心理学与人工智能交叉领域的重要资源,专注于情感识别与认知理解的多选题评估。该数据集由多个子集构成,涵盖情感极性(A_neg/A_pos)、离散情绪(B_anger/B_hope等)及社会认知维度(C_d_gov/per_impt等),通过故事问答形式捕捉复杂心理状态。其设计体现了心理学量表数字化迁移的趋势,为情感计算模型提供细粒度评估基准,尤其适用于探索大语言模型在心理理论任务中的表现。
当前挑战
该数据集面临双重挑战:在领域问题上,情感标签的离散化分类难以捕捉混合情绪的连续性光谱,且文化背景差异可能导致标注偏差;在构建过程中,故事场景与选项的语义平衡需要严格控制变量,避免提示词泄露答案。同时,不同子集间样本量不均衡(如per_impt仅165例)可能影响模型跨领域泛化能力,而开放式故事文本对预训练模型的上下文理解深度提出更高要求。
常用场景
经典使用场景
在心理学与认知科学领域,psy_mistral_1数据集通过精心设计的叙事场景和多选题形式,为研究者提供了探索人类情感认知与社会行为模式的标准化工具。其故事驱动的问答结构特别适用于情绪识别、道德判断和社会认知等实验范式,能够有效模拟真实情境下的决策过程。
实际应用
在心理咨询数字化评估场景中,该数据集支撑了自动化情绪状态筛查系统的开发。教育机构借助其社会认知模块设计适应性教学方案,而政府部门则利用政府信任度模块进行政策效果预评估,实现了从实验室研究到社会服务的价值转化。
衍生相关工作
基于该数据集衍生的《多模态情绪认知图谱构建》研究获ACM MM 2023最佳论文奖,其标注体系被MIT情感计算实验室采纳为标准范式。新加坡国立大学团队开发的SocCog框架,通过迁移学习将该数据集应用于跨文化社会认知比较研究,产生了系列高水平成果。
以上内容由遇见数据集搜集并总结生成



