thoughtworks/psychometric_personas

Name: thoughtworks/psychometric_personas
Creator: thoughtworks
Published: 2026-05-01 19:42:50
License: 暂无描述

Hugging Face2026-05-01 更新2025-09-13 收录

下载链接：

https://hf-mirror.com/datasets/thoughtworks/psychometric_personas

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了个人的身份信息、特征描述、人口统计学信息、行为和心理描述符、生活历史片段以及功能评估等信息。数据集旨在为心理评估和人格分析提供支持，包含训练集。

The dataset includes personal identity information, characteristic descriptions, demographic information, behavioral and psychological descriptors, life history segments, and functional assessments. It is designed to support psychological evaluation and personality analysis, containing a training set.

提供机构：

thoughtworks

搜集汇总

数据集介绍

构建方式

在人工智能与社会科学交叉领域，角色条件化语言模型的行为研究日益重要。该数据集以大规模合成方式构建，基于8种截然不同的执法原型（如服务型警官、强硬执法者、问题解决者等）生成8,500个精细化的执法人格。每个样本通过多层级条件化框架构建，涵盖人口统计学特征（年龄、性别、教育背景等）、心理轮廓描述（思维内容、洞察判断、认知能力等）以及行为与外观编码。数据集的构建过程融合了结构化叙事生成，利用原型描述作为先验，结合回忆录、行为类别和情感状态等字段，形成具有现实感和行为一致性的合成人格。同时，数据集包含扩展版、注释版和对比版等多个配置，以适应不同研究需求。

使用方法

该数据集适用于多种自然语言处理与计算社会科学研究场景。用户可以通过HuggingFace Datasets库轻松加载不同配置（如default、base、expanded等），各配置均以训练集形式提供。研究者可将persona_string字段作为语言模型的系统提示进行角色条件化实验，评估模型在不同执法人格下的行为偏移与一致性。annotated配置中的结构化注解可用于训练人格质量评估模型。concat_embedding字段支持进行基于向量的相似度检索与聚类分析。此外，comparison_*子集可用于比较不同语言模型生成的执法人格在心理深度、真实感等维度上的差异，为模型对齐研究提供基准。

背景与挑战

背景概述

心理测量人格数据集（psychometric_personas）由研究团队于2025年构建，旨在探索语言模型在高风险领域（如执法场景）中基于角色条件化的行为模式与对齐特性。该数据集通过合成8种执法原型的8,500个人格，填补了现有数据集在领域特异性、行为基础结构化以及现实变异性捕捉方面的空白。其核心研究问题聚焦于评估语言模型在权威或制度驱动语境下的行为漂移、人格稳定性及潜在偏见，对理解人工智能在安全与伦理关键领域的部署具有深远影响。

当前挑战

该数据集所解决的领域挑战在于，现有角色扮演数据集缺乏领域特异性与结构化行为约束，难以真实反映专业权威角色中的行为变异性。构建过程中面临的关键挑战包括：设计能够涵盖执法领域多样行为倾向（如服务导向、权威主义、回避型）的8种核心原型；确保合成人格在人口统计特征（年龄、性别、族裔等）与心理剖面维度（认知、情感、社会功能）上保持内在一致性与现实性；以及通过多配置版本（如注释版、扩展版）实现人格质量的标准化评估与跨模型对比验证。

常用场景

经典使用场景

在心理测量与自然语言处理交叉领域，psychometric_personas数据集被广泛用于构建和评估具备特定人格轮廓与行为倾向的合成智能体。该数据集的核心价值在于通过结构化档案描述，为大型语言模型提供精细化的角色条件，从而模拟真实世界中个体在执法、心理评估或公共服务等场景下的决策风格、语言模式与行为一致性。研究者常利用其丰富的元数据字段（如情感状态、认知判断、人际功能）来校准模型对复杂社会角色的理解能力，尤其适合进行角色驱动下的对话生成、行为预测以及社会计算研究。

解决学术问题

该数据集着重回应了现有语料库在领域专用性与行为一致性方面的双重缺失，特别是在高权威性职业角色建模中，传统数据集往往无法提供足够细粒度的心理与行为锚定。psychometric_personas通过引入基于八种执法原型的层级化条件，有效支撑了对语言模型在角色扮演中行为偏移、偏见固化及角色稳定性等问题的系统探究。它为学术界提供了一种可量化、可复现的基准，用以评估模型在权威情境下的对齐程度与伦理风险，推动了可信人工智能在公共安全等敏感领域的发展。

实际应用

在实际场景中，psychometric_personas数据集可应用于执法培训模拟系统，通过生成具有不同执纪风格（如服务导向型或威权型）的虚拟警员，辅助受训人员适应多元化的沟通策略与冲突处理技巧。此外，在心理健康辅助评估和智能客服系统中，该数据集能够为对话机器人注入富有心理深度的背景特征，使其在回应敏感话题时展现出更加真实且符合伦理的角色表现，从而提升人机交互的信任感与适应性。

数据集最近研究