five

MBTI-Myers-Briggs-Personality-Type-Dataset

收藏
github2024-02-17 更新2024-05-31 收录
下载链接:
https://github.com/dashascience/-MBTI-Myers-Briggs-Personality-Type-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含超过8600条数据,每条记录包含一个人的MBTI类型(4字母代码)和他们的最后50条发帖内容(每条内容通过|||分隔)。

This dataset comprises over 8,600 entries, each containing an individual's MBTI type (a 4-letter code) and their last 50 posts (each post separated by |||).
创建时间:
2019-02-04
原始信息汇总

数据集概述

数据集名称

MBTI-Myers-Briggs-Personality-Type-Prediction

数据集目的

预测个人的性格类型,基于他们所写的某些帖子。

性格类型系统

使用Myers Briggs Type Indicator (MBTI),该系统将人分为16种不同的性格类型,基于4个轴:

  • 内向 (I) - 外向 (E)
  • 直觉 (N) - 感觉 (S)
  • 思考 (T) - 情感 (F)
  • 判断 (J) - 感知 (P)

数据集内容

包含超过8600行数据,每行记录一个人的:

  • 类型:该人的4字母MBTI代码/类型
  • 内容:该人最近50条帖子的片段,每条记录以"|||"(3个管道字符)分隔
搜集汇总
数据集介绍
main_image_url
构建方式
MBTI-Myers-Briggs-Personality-Type-Dataset的构建基于用户在社交媒体上的发帖内容,通过收集超过8600条数据记录,每条记录包含用户的MBTI类型代码及其最近发布的50条帖子片段。这些帖子片段通过三个管道字符“|||”进行分隔,确保了数据的结构化和可分析性。数据集的构建过程注重用户隐私保护,仅提取公开可用的信息,未涉及个人敏感数据。
特点
该数据集的核心特点在于其丰富的文本内容和明确的MBTI类型标签。每个数据样本不仅包含用户的MBTI类型代码,还提供了其最近发布的50条帖子片段,这些文本内容为研究用户语言风格与人格特质之间的关系提供了宝贵资源。数据集涵盖了16种MBTI人格类型,覆盖了人格心理学的四个主要维度,具有较高的多样性和代表性。
使用方法
使用MBTI-Myers-Briggs-Personality-Type-Dataset时,研究者可通过分析用户的帖子内容,探索其语言特征与MBTI人格类型之间的关联。数据集适用于自然语言处理任务,如文本分类、情感分析和人格预测等。在使用过程中,建议对文本数据进行预处理,如分词、去除停用词等,以提高模型的训练效果。此外,研究者可结合机器学习或深度学习算法,构建人格类型预测模型,进一步验证数据集的实用价值。
背景与挑战
背景概述
MBTI-Myers-Briggs-Personality-Type-Dataset是一个基于Myers-Briggs类型指标(MBTI)的人格类型预测数据集,旨在通过分析个体的文本内容来推断其人格类型。MBTI作为一种广泛应用的人格分类系统,将人格划分为16种类型,涵盖四个维度:内向(I)与外向(E)、直觉(N)与感觉(S)、思考(T)与情感(F)、判断(J)与知觉(P)。该数据集由研究人员于近年构建,包含了超过8600条数据记录,每条记录包括个体的MBTI类型及其最近发布的50条文本内容。这一数据集的创建为心理学、自然语言处理以及个性化推荐系统等领域提供了重要的研究资源,推动了人格分析与文本挖掘的交叉研究。
当前挑战
MBTI-Myers-Briggs-Personality-Type-Dataset在构建与应用过程中面临多重挑战。首先,人格类型的标注依赖于个体的自我报告,可能存在主观偏差,影响数据质量。其次,文本内容的多样性与复杂性使得特征提取与分类任务变得困难,尤其是在处理非结构化数据时,如何有效捕捉人格特质成为关键问题。此外,MBTI模型本身在心理学界存在争议,其科学性与普适性尚未得到广泛认可,这为基于该数据集的研究带来了理论上的不确定性。在技术层面,如何设计高效的算法以从短文本中准确预测人格类型,同时避免过拟合与泛化能力不足,也是亟待解决的难题。
常用场景
经典使用场景
MBTI-Myers-Briggs-Personality-Type-Dataset在心理学和计算社会科学领域中被广泛用于研究人格类型与文本表达之间的关系。通过分析个体在社交媒体或其他平台上的文本数据,研究者能够预测其MBTI人格类型,从而深入探讨人格特质对语言使用模式的影响。
实际应用
在实际应用中,MBTI-Myers-Briggs-Personality-Type-Dataset被用于开发个性化推荐系统和心理评估工具。例如,企业可以利用该数据集分析员工的沟通风格,优化团队协作;心理咨询师则可以通过文本分析辅助诊断,提供更具针对性的心理辅导。
衍生相关工作
基于该数据集,许多经典研究工作得以展开,如基于深度学习的MBTI人格预测模型、人格类型与社交媒体行为的相关性研究等。这些研究不仅推动了人格心理学的发展,也为自然语言处理领域提供了新的研究方向和应用场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作