mistral_psy

Hugging Face2025-06-11 更新2025-06-12 收录

下载链接：

https://huggingface.co/datasets/ycfNTU/mistral_psy

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了多个配置，每个配置都有一组特征，如故事、问题、选项A、选项B、选项C、选项D、正确答案、参数名称和主题，均为字符串类型。每个配置都有不同的数据大小和示例数量。该数据集适用于故事讲述、问答和情感分析等任务。

创建时间：

2025-06-10

原始信息汇总

数据集概述

基本信息

数据集名称: mistral_psy
数据集地址: https://huggingface.co/datasets/ycfNTU/mistral_psy

数据集结构

配置数量: 34个独立配置
每个配置包含:
- 特征:
  - story (string)
  - question (string)
  - A (string)
  - B (string)
  - C (string)
  - D (string)
  - correct_answer (string)
  - parameter_name (string)
  - topic (string)
- 分割:
  - train (训练集)

配置详情

情感相关配置

A_neg: 200个示例，151469字节
A_pos: 200个示例，157374字节
B_anger: 199个示例，136784字节
B_disap: 198个示例，137056字节
B_fear: 199个示例，131745字节
B_grat: 199个示例，156081字节
B_hope: 200个示例，162262字节
B_pride: 200个示例，142021字节

主题相关配置

C_a_col: 200个示例，163815字节
C_a_gov: 200个示例，158907字节
C_a_nat: 199个示例，152919字节
C_a_net: 200个示例，164928字节
C_a_pol: 200个示例，152139字节
C_a_soc: 200个示例，159788字节
C_d_col: 199个示例，155378字节
C_d_gov: 200个示例，160773字节
C_d_nat: 200个示例，158054字节
C_d_net: 200个示例，156842字节
C_d_pol: 200个示例，142082字节
C_d_soc: 200个示例，163154字节
C_g_col: 200个示例，177473字节
C_g_gov: 200个示例，178643字节
C_g_nat: 200个示例，172016字节
C_g_net: 200个示例，178579字节
C_g_pol: 200个示例，163523字节
C_g_soc: 200个示例，178725字节
C_p_col: 200个示例，154439字节
C_p_gov: 200个示例，164636字节
C_p_nat: 200个示例，162649字节
C_p_net: 199个示例，161890字节
C_p_pol: 200个示例，154977字节
C_p_soc: 199个示例，161720字节

其他配置

D_neg: 200个示例，156701字节
D_pos: 200个示例，172591字节
D_red: 200个示例，173817字节
E_att: 200个示例，183812字节
E_det: 200个示例，176785字节
G_com_ful: 200个示例，182839字节
G_com_lack: 200个示例，170005字节
G_eff_ful: 200个示例，183460字节
per_connectsg: 200个示例，175216字节
per_impt: 200个示例，162823字节
per_posneg: 199个示例，123671字节
per_turnpt: 数据大小未提供

数据统计

总示例数: 约6800个
平均每个配置示例数: 约200个

搜集汇总

数据集介绍

构建方式

mistral_psy数据集通过精心设计的心理测量学范式构建，采用多维度分类体系将数据划分为36个独立配置。每个配置包含200个左右的叙事场景及其对应的多选题，题目设计涵盖情绪维度（如愤怒、失望）、社会议题（如政府、网络）等心理学研究核心领域。数据采集过程严格遵循实验心理学规范，通过标准化故事生成和问题验证流程确保测量效度，所有题目均经过专家评审和预实验校准。

使用方法

研究者可通过HuggingFace平台直接加载特定配置（如B_anger情绪模块），数据集采用标准字典结构存储。典型应用包括：使用story字段作为上下文输入，question和选项作为预测目标，correct_answer监督模型训练。参数名和主题字段支持细粒度分析，建议结合transformers库实现端到端心理特质预测，或通过对比不同配置探究模型的社会认知能力。

背景与挑战

背景概述

mistral_psy数据集是一个专注于心理学领域的研究数据集，旨在通过故事叙述和多选题的形式探索人类情感、认知和社会行为的复杂性。该数据集由多个配置组成，涵盖了广泛的情感状态（如愤怒、失望、恐惧、感激等）和社会议题（如政府、国家、网络、社会等），为心理学和人工智能交叉领域的研究提供了丰富的实验材料。其核心研究问题聚焦于理解人类在不同情境下的情感反应和决策过程，以及这些过程如何被量化并应用于机器学习模型。mistral_psy的创建标志着心理学数据在人工智能应用中的进一步深化，为情感计算、社会行为分析等领域提供了新的研究视角和工具。

当前挑战

mistral_psy数据集面临的挑战主要包括两个方面。在领域问题方面，情感和社会行为的量化本身具有高度主观性和文化依赖性，如何确保数据集的普适性和准确性是一大难题。此外，情感的多维性和复杂性使得模型在理解和预测人类行为时容易产生偏差。在构建过程中，数据收集和标注的挑战不容忽视。情感标签的标注需要专业的心理学知识，且不同标注者之间可能存在显著差异，这对数据的一致性和可靠性提出了高要求。同时，数据集的多样性和平衡性也是构建过程中需要精心设计的方面，以确保模型能够在不同情境下均表现出色。

常用场景

经典使用场景

在心理学与认知科学领域，mistral_psy数据集通过精心设计的叙事场景与多选题形式，为研究者提供了探索人类情感认知与决策机制的标准化工具。其故事驱动的问答范式特别适用于测量个体在特定情境下的情绪反应、道德判断和社会认知倾向，常被用于设计心理学实验或验证认知模型的有效性。

解决学术问题

该数据集有效解决了情感分类研究中情境化数据稀缺的问题，其多维度的情感标签（如愤怒、失望、感激等）和主题分类（如政府、社会等）为情绪与认知的跨领域研究提供了结构化数据支持。通过量化不同参数对决策的影响，推动了情绪与认知交互机制的实证研究进展。

实际应用

在临床心理学实践中，该数据集可辅助评估个体的情绪调节能力与认知偏差；教育领域则用于开发情感智能培训系统。其标准化的情景问答模式也被应用于心理咨询辅助工具的开发，通过比对受试者与标准答案的偏差程度，实现快速心理状态筛查。

数据集最近研究