five

Twin-2K-500

收藏
arXiv2025-05-23 更新2025-05-27 收录
下载链接:
https://huggingface.co/datasets/LLM-Digital-Twin/Twin-2K-500/
下载链接
链接失效反馈
官方服务:
资源简介:
Twin-2K-500是一个大规模公开数据集,旨在通过超过500个问题的回答,捕捉个人行为的丰富和全面视图。数据集由美国2,058名代表性参与者回答,涵盖人口统计、心理、经济、个性、认知等方面的测量,以及行为经济学实验的复制品和定价调查。数据集通过四次调查收集,每次调查约2.42小时。通过公开提供完整数据集,旨在为基于LLM的人物模拟的开发和基准测试建立一个有价值的测试平台。此外,数据集的独特广度和规模也使其能够进行广泛的社会科学研究,包括跨结构相关性和异质处理效应的研究。

Twin-2K-500 is a large-scale public dataset designed to capture a rich and comprehensive portrait of individual behaviors through responses to over 500 questions. The dataset is answered by 2,058 representative participants in the United States, covering measurements across demographic, psychological, economic, personality, and cognitive domains, as well as replications of behavioral economics experiments and pricing surveys. The dataset was collected across four survey waves, each lasting approximately 2.42 hours. By publicly releasing the full dataset, this work aims to establish a valuable testbed for the development and benchmarking of LLM-powered human simulation. Furthermore, the unique breadth and scale of the dataset also enable a wide range of social science research, including studies on cross-structure correlations and heterogeneous treatment effects.
提供机构:
哥伦比亚大学
创建时间:
2025-05-23
搜集汇总
数据集介绍
main_image_url
构建方式
Twin-2K-500数据集的构建采用了多波次问卷调查的方法,涵盖了2058名美国代表性样本。研究通过四轮调查,每轮包含总计500个问题,涉及人口统计学、心理学、经济学、人格特质和认知能力等多个维度。数据收集过程中,参与者平均耗时2.42小时,确保了数据的全面性和深度。此外,第四轮调查重复了前几轮的部分任务,以建立测试-重测准确性的基准。
特点
Twin-2K-500数据集以其规模和广度著称,涵盖了丰富的个体行为数据,包括心理量表、认知能力测试、经济偏好问卷以及行为经济学实验的复现。数据集的高质量体现在其良好的测试-重测准确性、与已知行为经济学结果的高度一致性以及各测量指标间的显著相关性。此外,数据集还包含了数字孪生构建所需的原始数据,为LLM模拟人类行为提供了可靠的基础。
使用方法
Twin-2K-500数据集的使用方法多样,主要包括构建和验证基于LLM的数字孪生模型。研究人员可以利用数据集中的非保留数据训练数字孪生,并使用保留数据评估其预测准确性。此外,数据集还可用于社会科学研究,如跨构造相关性分析和异质性处理效应研究。数据集以模块化JSON格式提供,便于研究人员根据需求进行定制化分析和模型开发。
背景与挑战
背景概述
Twin-2K-500数据集由哥伦比亚大学的Olivier Toubia、George Z. Gui、Tianyi Peng等研究人员于2025年创建,旨在解决基于大型语言模型(LLM)的数字孪生模拟研究中缺乏大规模、公开可用的个体级别数据的问题。该数据集通过调查2058名美国参与者,收集了超过500个问题的回答,涵盖了人口统计学、心理学、经济学、人格特质和认知能力等多个维度。数据收集分为四个阶段,平均每位参与者耗时2.42小时,最终阶段重复了早期阶段的任务以建立重测准确性基线。Twin-2K-500的发布为LLM驱动的数字孪生模拟提供了宝贵的测试平台,同时也为社会科学研究提供了广泛的数据支持。
当前挑战
Twin-2K-500数据集面临的挑战主要包括两个方面:首先,在解决领域问题方面,数字孪生模拟需要准确预测个体和群体行为,但LLM生成的回答可能受到提示架构的影响,导致行为模拟不够准确或代表性不足。其次,在数据构建过程中,研究人员需要处理大规模数据收集的复杂性,包括确保数据的代表性和质量,以及设计有效的重测机制以验证数据的可靠性。此外,数据集的公开可用性要求研究人员在保护参与者隐私的同时,提供足够详细的数据以支持多样化的研究需求。
常用场景
经典使用场景
Twin-2K-500数据集在数字孪生模拟领域具有广泛的应用价值,尤其在基于大语言模型(LLM)的人类行为仿真研究中表现突出。该数据集通过收集2058名参与者的500多个问题的回答,涵盖了人口统计、心理特征、经济偏好等多个维度,为构建高保真度的数字孪生提供了丰富的数据支持。研究人员可以利用该数据集训练和验证LLM模型,模拟个体在特定情境下的决策过程,从而在社会科学实验、市场调研和政策评估等领域实现低成本、高效率的人类行为预测。
衍生相关工作
该数据集已催生多项创新研究,包括LLM提示架构优化、行为预测模型比较等方向。Park等人(2024)基于类似数据开发的生成式智能体框架,验证了数字孪生在群体行为模拟中的潜力。Brucks和Toubia(2023)利用数据集揭示了提示工程对LLM输出的影响,为消除仿真偏差提供了方法论指导。在跨学科应用方面,Santurkar等人(2023)的研究展示了如何利用此类数据评估LLM的社会代表性,推动了AI伦理研究的发展。
数据集最近研究
最新研究方向
近年来,Twin-2K-500数据集在构建基于大型语言模型(LLM)的数字孪生(digital twins)领域引起了广泛关注。该数据集通过收集2058名美国参与者的500个问题的回答,涵盖了人口统计、心理、经济、人格和认知等多个维度的数据,为研究个体行为提供了丰富的基础。前沿研究方向主要集中在利用该数据集验证数字孪生在预测个体和群体行为方面的准确性,以及探讨其在社会科学实验中的潜在应用。热点事件包括数字孪生在医疗和政治领域的偏差研究,以及如何通过透明、可靠的方法验证其有效性。这一数据集的发布不仅推动了LLM在模拟人类行为方面的发展,还为跨学科研究提供了宝贵的资源。
相关研究论文
  • 1
    Twin-2K-500: A dataset for building digital twins of over 2,000 people based on their answers to over 500 questions哥伦比亚大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作