five

包含半结构化面试记录和经过验证的连续五大人格特质评分的新基准数据集

收藏
arXiv2025-09-17 更新2025-09-18 收录
下载链接:
https://anonymous.4open.science/status/AAAI2026personality-D7CB
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由518位成年参与者的半结构化面试记录组成,每位参与者都配有人格特质评分。该数据集旨在评估大型语言模型在预测人格特质方面的能力,为开发更准确和可靠的人格预测模型提供基础。

This dataset comprises semi-structured interview records from 518 adult participants, each paired with their respective personality trait scores. It aims to evaluate the capability of large language models (LLMs) in predicting personality traits, providing a foundation for developing more accurate and reliable personality prediction models.
提供机构:
肯特州立大学计算机科学系和心理学系
创建时间:
2025-09-17
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建过程依托真实世界半结构化访谈环境,涵盖518名成年参与者的对话记录。每位参与者均完成标准化BFI-10量表测评,获得经过验证的连续性五大人格特质评分。访谈采用标准化提示语引导,每位参与者针对每日活动、情绪调节等主题进行三分钟自由叙述,录音内容经专业转写后形成文本语料。数据集在人口统计学维度保持多样性平衡,确保样本在性别、年龄、种族及教育背景上的代表性。
特点
本数据集核心特点在于其生态效度与心理测量学严谨性的结合。所有人格标签均来自金标准BFI-10工具的连续型评分,突破传统二分类简化框架。文本内容源自真实临床访谈场景,包含情感表达、生活事件叙述等自然语言特征,与社交媒体文本形成鲜明对比。数据规模与质量支持对开放性、神经质等复杂特质的细粒度分析,为模型对齐研究提供高信度基准。
使用方法
数据集支持三种主流建模范式的评估:基于GPT-4.1Mini的零样本提示与思维链提示技术,适用于探究模型推理能力;采用LoRA微调策略适配RoBERTa与LLaMA架构,验证参数效率优化效果;利用预训练BERT与OpenAI嵌入特征的岭回归分析,检验静态表征的预测效力。评估体系采用皮尔逊相关系数与平均绝对误差双指标,确保从排名一致性到绝对标度误差的全维度性能度量。
背景与挑战
背景概述
随着大型语言模型在情感支持代理和决策辅助等需要心理理解能力的角色中广泛应用,其解读人类人格特质的能力成为关键研究议题。肯特州大学计算机科学与心理科学系的研究团队于2025年创建了首个包含半结构化面试记录与连续五大人格特质评分的基准数据集。该数据集基于518名成年人的真实对话数据,采用经过验证的BFI-10量表进行人格标注,旨在解决传统研究中人格构建简化与生态效度不足的问题,为计算语言学与心理学的交叉领域提供了重要的实证基础。
当前挑战
该数据集致力于解决从自然语言中推断连续人格特质的核心挑战,包括模型预测与真实心理测量数据之间的低相关性(皮尔逊相关系数普遍低于0.26),以及外向性和宜人性等特质建模的一致性难题。在构建过程中,研究者面临多重挑战:需确保半结构化访谈的生态效度与标准化转录规范,处理长文本输入与模型上下文限制的技术矛盾,以及在有限样本量下保持人口学多样性所带来的数据平衡问题。
常用场景
经典使用场景
在心理学与计算语言学的交叉领域,该数据集为大型语言模型的人格推断能力提供了首个生态效度验证基准。其半结构化访谈记录与连续五大人格特质评分的配对设计,被广泛用于评估模型在真实对话场景中对开放性、尽责性等人格维度的推理准确性。研究者通过零样本提示、思维链推理及参数高效微调等范式,系统检验模型从自然语言中捕捉心理特征的能力。
实际应用
在心理健康筛查领域,该数据集支持开发具有人格感知能力的临床辅助系统,通过分析访谈语言特征实现早期心理风险预警。人机交互场景中,其连续人格评分机制为个性化对话代理提供了校准依据,使系统能根据用户特质调整响应策略。此外,在社会科学研究中,该数据集为探索语言与人格的关联机制提供了真实世界的数据支撑。
衍生相关工作
该数据集催生了多项人格计算领域的创新研究,例如基于LoRA的参数高效微调方法在RoBERTa架构上的应用,以及针对神经质和开放性特质的嵌入回归模型优化。相关研究进一步探索了思维链提示在人格推理中的有效性边界,并衍生出面向临床场景的多模态人格推断框架,推动了心理计算模型向生态化、精细化方向发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作