psy_mistral_3
收藏Hugging Face2025-06-13 更新2025-06-14 收录
下载链接:
https://huggingface.co/datasets/ycfNTU/psy_mistral_3
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含故事、问题及其四个选项和正确答案的数据集,旨在用于训练自然语言处理模型。数据集包含多个配置,每个配置都有对应的训练集,其中包含不同数量的示例。字段包括故事文本、问题文本、四个选项文本、正确答案、参数名称和主题。
创建时间:
2025-06-13
搜集汇总
数据集介绍

构建方式
在心理学研究领域,psy_mistral_3数据集的构建体现了严谨的实验设计理念。该数据集通过多维度配置(如D_neg、D_pos等21种参数组合)系统性地组织数据,每个配置包含198-200个训练样本,采用故事叙述与选择题相结合的范式。数据条目包含故事背景、四选一问题、标准答案及主题标签,通过统一的字符串格式确保数据结构化程度,所有分卷均采用相同的特征字段以保证数据一致性。
特点
该数据集最显著的特点在于其精细的心理测量维度划分,每个配置名称隐含着特定的实验变量操控(如D_neg可能对应负面情绪维度)。数据条目采用叙事性刺激材料配合标准化选择题,既保留自然语言复杂性又具备量化评估优势。各分卷保持高度均衡的样本量(平均199例)和相近的数据规模(148-185KB),这种设计有利于控制变量进行对比研究。参数名称与主题标签的双重标注为跨维度分析提供了便利。
使用方法
研究者可通过HuggingFace平台按需加载特定配置(如HI_hdw或J_coh),每个分卷均以train拆分形式存储。典型应用流程包括:解析story字段获取实验情境,通过question和ABCD选项构建心理测量项目,利用correct_answer验证模型输出。参数名称字段支持特定心理构念的筛选分析,而topic标签可实现跨研究主题的聚合计算。数据规模适中(单配置约170KB)的特点使其既适合学术研究也便于教学演示。
背景与挑战
背景概述
psy_mistral_3数据集是心理学与人工智能交叉领域的重要资源,专注于心理认知评估与决策行为的多维度分析。该数据集由专业研究团队构建,旨在通过结构化的故事叙述与选择题形式,探究人类在复杂情境下的认知机制与行为模式。数据集涵盖多个心理学参数,包括注意力分配、决策效率、社会公平感知等核心维度,为认知建模与行为预测研究提供了标准化评估框架。其模块化设计支持不同心理构念的独立分析,推动了计算心理学领域的范式创新与方法论进步。
当前挑战
该数据集面临的核心挑战体现在认知建模的复杂性与数据标注的可靠性两个层面。心理学概念的抽象性导致参数化过程需要平衡理论严谨性与计算可行性,例如决策偏差的量化需解决维度缩减时的信息损失问题。数据构建阶段面临情境设计的生态效度挑战,既要保证实验控制又要维持现实相关性。标注一致性受主观判断影响,跨参数的可比性需要严格的信效度检验。此外,模型泛化要求克服样本分布偏差,特别是文化因素对心理特征表达的潜在影响。
常用场景
经典使用场景
在心理学与认知科学领域,psy_mistral_3数据集通过故事叙述与多选问题的形式,为研究者提供了探索人类决策机制与认知偏差的丰富素材。其经典使用场景包括设计实验以验证特定心理效应,如确认性偏差或框架效应,以及训练机器学习模型模拟人类认知过程。
解决学术问题
该数据集通过系统化的参数控制(如D_neg与D_pos配置),解决了心理学研究中实验条件难以标准化的问题。其标注的正确答案与参数名称,为量化分析认知偏差提供了可靠基准,显著提升了实验结果的复现性,推动了认知建模领域的理论发展。
衍生相关工作
基于该数据集衍生的经典工作包括认知计算模型(如基于注意力机制的心理预测框架)和跨文化心理学研究。部分研究通过结合G_eff_ful等配置,构建了决策树模型以预测个体在资源分配情境中的选择倾向,相关成果发表于计算心理学期刊。
以上内容由遇见数据集搜集并总结生成



