big-five-personality-traits

Hugging Face2025-12-06 更新2025-12-07 收录

下载链接：

https://huggingface.co/datasets/agentlans/big-five-personality-traits

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含基于大五人格特质（OCEAN）模型的AI生成描述。对于每个特质和强度级别（1-5），由十个不同的聊天机器人（包括Grok、Gemini、Claude等）生成了五个描述。数据集支持人物创建、比较语言分析以及研究AI模型如何描述心理特质等任务，但不适用于心理评估。数据集包含五个特质（开放性、尽责性、外向性、宜人性和神经质）的描述，每个描述包括特质名称、强度级别、描述文本和生成描述的AI模型来源。

This dataset contains AI-generated descriptions based on the Big Five Personality Traits (OCEAN) model. For each trait and intensity level (1-5), five descriptions were generated by ten different chatbots including Grok, Gemini, Claude and other models. The dataset supports tasks such as persona creation, comparative linguistic analysis, and research on how AI models describe psychological traits, but it is not suitable for psychological assessment. The dataset includes descriptions for the five traits (Openness, Conscientiousness, Extraversion, Agreeableness, and Neuroticism), with each description containing the trait name, intensity level, descriptive text, and the AI model source that generated the description.

创建时间：

2025-12-05

原始信息汇总

Big Five Personality Traits 数据集概述

数据集基本信息

数据集名称：Big Five Personality Traits Dataset
发布者：agentlans
许可证：Creative Commons Attribution 4.0 (CC BY 4.0)
主要语言：英语 (en)
任务类别：文本分类 (text-classification)
标签：Big Five, OCEAN model, personality, AI-generated text, psychology traits, language models, persona creation, trait analysis, comparative linguistics

数据集内容与结构

该数据集包含基于大五人格（OCEAN）模型由人工智能生成的人格特质描述。针对每个特质及其强度等级（1-5），由十个不同的聊天机器人各生成了五条描述。这些机器人包括：Grok, Gemini, Claude, KimiK2 (通过 HuggingChat), Deepseek, MetaAI, Perplexity, LeChat, ChatGPT, 和 Copilot。

涵盖的人格特质

特质	概要
开放性 (Openness)	好奇心、想象力、对新思想的开放度
尽责性 (Conscientiousness)	条理性、勤奋、可靠性
外倾性 (Extraversion)	社交性、活力、自信果断
宜人性 (Agreeableness)	合作性、同理心、热情
神经质 (Neuroticism)	情绪稳定性、焦虑、压力反应性

数据字段 (CSV格式)

trait — 五个OCEAN维度之一。
level — 从1（非常低）到5（非常高）的序数等级。
description — 对该等级下特质的单句描述。
source — 生成描述的AI模型。

数据集用途

该数据集可用于支持以下任务：

人物角色创建
比较语言分析
关于AI模型如何描述心理特质的研究

重要说明：该数据集未经过心理评估验证，不适用于实验或诊断用途。

使用示例

数据集可用于构建随机人格生成器等应用，为每个特质随机生成强度等级及对应的AI描述。示例代码展示了如何加载数据集并生成包含多个特质描述的人格档案。

局限性

不适用于实验或诊断用途。
可能包含取决于模型的语言或文化偏见。
人格表达可能因社会和文化背景而异。

许可证信息

采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可证，可自由使用、分享和改编，但需注明出处。

搜集汇总

数据集介绍

构建方式

在人格心理学领域，大五人格模型为理解个体差异提供了稳健的理论框架。本数据集基于该模型，通过十种主流人工智能模型（包括Grok、Gemini、Claude等）系统生成人格特质描述。针对开放性、尽责性、外向性、宜人性和神经质这五个维度，每个维度均设定了从1（极低）到5（极高）的强度等级，并为每个等级生成了五条描述文本，从而构建了一个结构化的、由人工智能生成的人格描述语料库。

使用方法

该数据集主要服务于计算语言学和人工智能研究领域。研究者可利用其进行人格角色构建、不同AI模型的语言风格比较分析，或作为训练文本分类模型的语料。数据集已集成至Hugging Face平台，用户可通过`datasets`库便捷加载。随附的示例代码展示了一个随机人格生成器的实现，演示了如何根据特定分布（如均匀分布或正态分布）为每个特质抽样生成描述，为相关应用开发提供了实用起点。

背景与挑战

背景概述

在心理学与计算语言学交叉领域，人格特质建模一直是理解人类行为与语言表达关联的核心议题。Big Five Personality Traits数据集由研究人员通过整合十种主流人工智能模型生成，基于经典的大五人格（OCEAN）理论框架构建，涵盖了开放性、尽责性、外向性、宜人性与神经质五个维度的描述文本。该数据集的创建旨在探索人工智能模型如何表征心理特质，为人格计算、个性化对话系统及跨模型语言比较研究提供结构化资源，推动了人格特质在自然语言处理任务中的可操作化应用。

当前挑战

该数据集致力于解决人格特质文本分类与生成任务中的挑战，即如何将心理学中连续、多维的人格构念转化为机器可理解的离散语言描述，并确保生成文本在语义上与特质强度水平保持一致。在构建过程中，研究者面临多重挑战：不同人工智能模型生成的语言可能存在系统性偏见或文化特定表达，影响描述的普适性；同时，人格特质的表现高度依赖社会文化语境，而数据集未经过实证心理学验证，限制了其在临床或诊断场景中的适用性；此外，协调多模型输出以保持描述的一致性与可比性，亦是数据整合阶段的技术难点。

常用场景

经典使用场景

在计算心理学与自然语言处理交叉领域，该数据集为研究者提供了一个标准化的基准，用于探索不同人工智能模型如何依据大五人格理论生成人格特质描述。经典使用场景包括构建虚拟角色的人格档案，通过随机采样不同特质与强度级别的描述，快速生成多样化的角色背景，从而支持对话系统或叙事生成中的人格一致性建模。

解决学术问题

该数据集主要解决了人工智能生成文本在人格表征方面的可比较性问题，为研究不同模型的语言风格、文化偏见及心理特质描述的准确性提供了结构化数据。其意义在于推动了人格计算领域的发展，使得研究者能够系统分析AI模型在模拟人类心理特质时的共性与差异，为评估模型的心理语言学特性奠定了实证基础。

实际应用

在实际应用中，该数据集可被集成至聊天机器人或虚拟助手的人格定制模块，通过调整特质强度来塑造更具人性化的交互体验。此外，在游戏开发与互动叙事中，它能够辅助生成非玩家角色的背景故事，增强角色的可信度与沉浸感，同时为教育模拟中的角色扮演提供人格描述素材。

数据集最近研究