PRIMEX
收藏arXiv2025-10-01 更新2025-10-04 收录
下载链接:
https://github.com/apple/ml-primex
下载链接
链接失效反馈官方服务:
资源简介:
PRIMEX数据集由858名美国居民的公开意见调查数据组成,包含三个来源的信息:受访者为特定意见提供的书面解释,以及用于评估受访者的世界观的原始世界观调查。数据集收集了来自不同地区、年龄、教育水平和性别的匿名调查响应。数据集旨在帮助研究世界观和个人化语言模型,并已在自然语言处理和心理研究领域取得了显著成果。
提供机构:
苹果公司, 南加州大学
创建时间:
2025-10-01
搜集汇总
数据集介绍

构建方式
PRIMEX数据集的构建采用多维度调查方法,通过第三方研究机构招募858名美国居民参与者,确保地理分布、年龄层次和性别比例的相对平衡。数据收集涵盖三个核心模块:从美国趋势面板调查中选取熵值较高的30个跨领域观点问题,对其中9个关键问题收集参与者的自由文本解释,并采用18项原始世界信念量表量化参与者的世界观维度。所有调查流程经过伦理审查委员会监督,参与者享有知情同意与数据撤回权利,最终形成包含观点、解释与世界观三元结构的标准化数据集。
特点
PRIMEX的独特性体现在三重深度标注架构:首先,每个参与者提供跨生物伦理、经济公平与社会发展三大领域的观点数据,突破传统数据集中个体信息单一主题的局限;其次,针对核心观点收集的自然语言解释揭示信念系统的形成逻辑,其中高效用解释平均长度达333词且与测试问题语义关联度显著;最后,通过心理学验证的原始世界信念量表捕获世界观维度,数据显示安全信念与儿童未来生活标准观点存在0.326强相关性,展现世界观与认知行为的深层联结。
使用方法
该数据集支持基于用户表征的语言模型个性化研究,典型应用包含三种范式:在观点预测任务中,将用户人口属性、种子观点与世界观分数组合为文本提示,指导语言模型预测未见过的问题响应;跨主题泛化实验中,利用Wave34的调查数据训练模型,评估其在Wave41和54主题上的迁移能力;世界观推断任务则通过微调语言模型,从用户观点与解释中重建其原始信念分数。所有实验需遵循训练集(430人)与测试集(428人)的固定划分以确保可复现性。
背景与挑战
背景概述
PRIMEX数据集由苹果公司与南加州大学的研究团队于2025年联合创建,聚焦于探索语言模型个性化与人类世界观之间的深层关联。该数据集通过采集858名美国居民的公共舆论调查数据,创新性地整合了原始世界观信念评估与受访者的自由文本解释,旨在构建多维度的用户信念表征系统。其核心研究在于揭示世界观、个人解释与意见形成之间的相互作用,为心理学与自然语言处理领域的交叉研究提供了前所未有的实证基础,推动了基于信念建模的个性化语言模型发展。
当前挑战
PRIMEX面临的领域挑战在于解决个性化语言模型中用户意见预测的准确性与泛化能力不足的问题,尤其在跨主题意见推断方面存在显著困难。构建过程中的挑战包括:确保多元人口统计特征的代表性以克服数据偏差,平衡高质量自由文本解释的采集成本与语义丰富度,以及将抽象的世界观概念转化为可计算的心理测量指标。此外,在保持用户隐私与伦理标准的同时,实现大规模、多模态用户数据的标准化整合亦是关键难点。
常用场景
经典使用场景
在自然语言处理领域,PRIMEX数据集为个性化语言模型研究提供了独特支持。该数据集通过整合858名美国受访者的世界观调查、意见表达与解释文本,构建了多维度的用户表征体系。研究人员可基于世界观评分与自由文本解释,探索语言模型对个体信念系统的建模能力,特别是在跨主题意见预测任务中展现其独特价值。
实际应用
在实际应用层面,PRIMEX为构建高拟真度模拟人格系统提供了数据基础。教育领域可基于世界观特征生成具有特定认知倾向的虚拟对话伙伴,社会计算研究能通过解释文本分析群体决策机制。商业场景中,该数据集支持开发更精准的个性化推荐系统,通过解析用户解释中隐含的价值观维度,提升服务匹配的语义深度。
衍生相关工作
该数据集已催生多项创新研究,包括基于世界观特征的人格模拟框架开发、解释文本效用量化分析方法,以及跨领域意见预测模型。相关研究进一步探索了原始世界观信念与语言风格的内在关联,推动了心理学量表的计算化重构。这些工作共同拓展了语言模型在认知科学与社会仿真中的应用边界。
以上内容由遇见数据集搜集并总结生成



