mistral_psy
收藏Hugging Face2025-06-11 更新2025-06-12 收录
下载链接:
https://huggingface.co/datasets/ycfNTU/mistral_psy
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了多个配置,每个配置都有一组特征,如故事、问题、选项A、选项B、选项C、选项D、正确答案、参数名称和主题,均为字符串类型。每个配置都有不同的数据大小和示例数量。该数据集适用于故事讲述、问答和情感分析等任务。
创建时间:
2025-06-10
原始信息汇总
数据集概述
基本信息
- 数据集名称: mistral_psy
- 数据集地址: https://huggingface.co/datasets/ycfNTU/mistral_psy
数据集结构
- 配置数量: 34个独立配置
- 每个配置包含:
- 特征:
- story (string)
- question (string)
- A (string)
- B (string)
- C (string)
- D (string)
- correct_answer (string)
- parameter_name (string)
- topic (string)
- 分割:
- train (训练集)
- 特征:
配置详情
情感相关配置
- A_neg: 200个示例,151469字节
- A_pos: 200个示例,157374字节
- B_anger: 199个示例,136784字节
- B_disap: 198个示例,137056字节
- B_fear: 199个示例,131745字节
- B_grat: 199个示例,156081字节
- B_hope: 200个示例,162262字节
- B_pride: 200个示例,142021字节
主题相关配置
- C_a_col: 200个示例,163815字节
- C_a_gov: 200个示例,158907字节
- C_a_nat: 199个示例,152919字节
- C_a_net: 200个示例,164928字节
- C_a_pol: 200个示例,152139字节
- C_a_soc: 200个示例,159788字节
- C_d_col: 199个示例,155378字节
- C_d_gov: 200个示例,160773字节
- C_d_nat: 200个示例,158054字节
- C_d_net: 200个示例,156842字节
- C_d_pol: 200个示例,142082字节
- C_d_soc: 200个示例,163154字节
- C_g_col: 200个示例,177473字节
- C_g_gov: 200个示例,178643字节
- C_g_nat: 200个示例,172016字节
- C_g_net: 200个示例,178579字节
- C_g_pol: 200个示例,163523字节
- C_g_soc: 200个示例,178725字节
- C_p_col: 200个示例,154439字节
- C_p_gov: 200个示例,164636字节
- C_p_nat: 200个示例,162649字节
- C_p_net: 199个示例,161890字节
- C_p_pol: 200个示例,154977字节
- C_p_soc: 199个示例,161720字节
其他配置
- D_neg: 200个示例,156701字节
- D_pos: 200个示例,172591字节
- D_red: 200个示例,173817字节
- E_att: 200个示例,183812字节
- E_det: 200个示例,176785字节
- G_com_ful: 200个示例,182839字节
- G_com_lack: 200个示例,170005字节
- G_eff_ful: 200个示例,183460字节
- per_connectsg: 200个示例,175216字节
- per_impt: 200个示例,162823字节
- per_posneg: 199个示例,123671字节
- per_turnpt: 数据大小未提供
数据统计
- 总示例数: 约6800个
- 平均每个配置示例数: 约200个
搜集汇总
数据集介绍

构建方式
mistral_psy数据集通过精心设计的心理测量学范式构建,采用多维度分类体系将数据划分为36个独立配置。每个配置包含200个左右的叙事场景及其对应的多选题,题目设计涵盖情绪维度(如愤怒、失望)、社会议题(如政府、网络)等心理学研究核心领域。数据采集过程严格遵循实验心理学规范,通过标准化故事生成和问题验证流程确保测量效度,所有题目均经过专家评审和预实验校准。
使用方法
研究者可通过HuggingFace平台直接加载特定配置(如B_anger情绪模块),数据集采用标准字典结构存储。典型应用包括:使用story字段作为上下文输入,question和选项作为预测目标,correct_answer监督模型训练。参数名和主题字段支持细粒度分析,建议结合transformers库实现端到端心理特质预测,或通过对比不同配置探究模型的社会认知能力。
背景与挑战
背景概述
mistral_psy数据集是一个专注于心理学领域的研究数据集,旨在通过故事叙述和多选题的形式探索人类情感、认知和社会行为的复杂性。该数据集由多个配置组成,涵盖了广泛的情感状态(如愤怒、失望、恐惧、感激等)和社会议题(如政府、国家、网络、社会等),为心理学和人工智能交叉领域的研究提供了丰富的实验材料。其核心研究问题聚焦于理解人类在不同情境下的情感反应和决策过程,以及这些过程如何被量化并应用于机器学习模型。mistral_psy的创建标志着心理学数据在人工智能应用中的进一步深化,为情感计算、社会行为分析等领域提供了新的研究视角和工具。
当前挑战
mistral_psy数据集面临的挑战主要包括两个方面。在领域问题方面,情感和社会行为的量化本身具有高度主观性和文化依赖性,如何确保数据集的普适性和准确性是一大难题。此外,情感的多维性和复杂性使得模型在理解和预测人类行为时容易产生偏差。在构建过程中,数据收集和标注的挑战不容忽视。情感标签的标注需要专业的心理学知识,且不同标注者之间可能存在显著差异,这对数据的一致性和可靠性提出了高要求。同时,数据集的多样性和平衡性也是构建过程中需要精心设计的方面,以确保模型能够在不同情境下均表现出色。
常用场景
经典使用场景
在心理学与认知科学领域,mistral_psy数据集通过精心设计的叙事场景与多选题形式,为研究者提供了探索人类情感认知与决策机制的标准化工具。其故事驱动的问答范式特别适用于测量个体在特定情境下的情绪反应、道德判断和社会认知倾向,常被用于设计心理学实验或验证认知模型的有效性。
解决学术问题
该数据集有效解决了情感分类研究中情境化数据稀缺的问题,其多维度的情感标签(如愤怒、失望、感激等)和主题分类(如政府、社会等)为情绪与认知的跨领域研究提供了结构化数据支持。通过量化不同参数对决策的影响,推动了情绪与认知交互机制的实证研究进展。
实际应用
在临床心理学实践中,该数据集可辅助评估个体的情绪调节能力与认知偏差;教育领域则用于开发情感智能培训系统。其标准化的情景问答模式也被应用于心理咨询辅助工具的开发,通过比对受试者与标准答案的偏差程度,实现快速心理状态筛查。
数据集最近研究
最新研究方向
在心理学与自然语言处理的交叉领域,mistral_psy数据集以其丰富的多维度情感和认知特征标注,正成为探索复杂心理状态建模的前沿工具。该数据集通过故事问答形式捕捉了愤怒、失望、感恩等细腻情感维度,以及政府、社会等不同话题下的认知倾向,为情感计算领域提供了细粒度分析的可能。近期研究聚焦于如何利用其多层次结构开发跨领域情感迁移学习框架,特别是在心理健康监测和舆情分析场景中,通过结合大语言模型的推理能力,提升对隐含心理状态的识别精度。
以上内容由遇见数据集搜集并总结生成



