SparkMe-SyntheticUsers

Name: SparkMe-SyntheticUsers
Creator: Social And Language Technology Lab
Published: 2026-04-05 08:47:27
License: 暂无描述

Hugging Face2026-04-05 更新2026-04-06 收录

下载链接：

https://huggingface.co/datasets/SALT-NLP/SparkMe-SyntheticUsers

下载链接

链接失效反馈

官方服务：

资源简介：

SparkMe-SyntheticUsers 是一个用于评估AI面试系统的合成用户档案数据集，包含200个模拟的劳动力参与者档案。每个档案包含从WorkBank种子数据生成的元数据（如职业、性别、教育程度、LLM熟悉度等）、用于模拟面试的随机排列的人物事实列表（user_shuffled_facts）以及结构化真实面试笔记（user_ground_truth_notes）。这些笔记覆盖了10个关于AI在工作场所影响的话题，共48个子话题。数据集适用于文本生成任务，可用于评估面试系统的覆盖范围、涌现性和流畅性等指标。

提供机构：

Social And Language Technology Lab

创建时间：

2026-04-05

搜集汇总

数据集介绍

构建方式

在人工智能面试系统评估领域，SparkMe-SyntheticUsers数据集通过系统化流程构建而成。该数据集基于WorkBank工人种子数据，利用SparkMe的用户代理管道生成了200个合成用户档案。每个档案均包含从种子数据中提取的人口统计元数据，如职业、性别、教育背景及大语言模型熟悉度等。构建过程中，生成了随机排列的人物事实列表作为模拟面试时输入大语言模型用户代理的素材，并针对10个职场人工智能影响主题生成了结构化的真实面试笔记，作为覆盖评估的基准数据。

特点

该数据集的核心特征在于其高度结构化的模拟用户表示。每个用户档案均配备详细的人口统计与背景元数据，确保了评估场景的多样性。随机排列的人物事实列表模拟了真实访谈中信息呈现的非顺序性，增强了评估的鲁棒性。尤为突出的是其结构化的真实笔记，覆盖了从背景介绍到未来展望的10个主题共48个子主题，为系统性能评估提供了细致且可量化的标准。这种设计使得数据集能够支持覆盖率、涌现性和流畅度等多维度指标的精确计算。

使用方法

使用该数据集时，研究人员可通过Hugging Face的datasets库直接加载。加载后，数据集提供完整的用户档案，包括用户ID、元数据、随机事实列表和真实笔记。主要应用于评估人工智能驱动的面试或对话系统，通过将系统输出与数据集中的结构化真实笔记进行比对，可以量化系统在探索预设主题方面的覆盖深度与广度。该数据集为定性洞察发现研究提供了标准化的测试基准，支持对访谈系统质量进行可重复的、基于证据的评估。

背景与挑战

背景概述

随着人工智能技术在职场应用的深化，对AI面试系统进行有效评估的需求日益凸显。SparkMe-SyntheticUsers数据集应运而生，由SALT-NLP研究团队于2026年创建，旨在为AI驱动的半结构化访谈系统提供高质量的合成用户档案。该数据集基于WorkBank种子数据，通过SparkMe用户代理管道生成，包含了200个模拟职场参与者的详细档案，涵盖人口统计元数据、随机排列的人物事实以及跨10个主题的结构化真实访谈笔记。其核心研究问题聚焦于如何系统评估访谈系统在覆盖率、涌现性和流畅性等维度的表现，从而推动人机交互与定性洞察发现领域的方法学进步。

当前挑战

在评估AI面试系统领域，主要挑战在于如何构建既具多样性又贴近真实场景的评估基准，以准确衡量系统在复杂、开放式对话中捕捉深层用户洞察的能力。具体而言，该领域需克服合成数据与真实用户行为之间的分布差距，确保评估结果具有外部效度。在数据集构建过程中，挑战体现在从原始种子数据生成连贯、一致且富含细节的合成用户档案，同时保持人口统计特征的合理分布与事实逻辑的无矛盾性。此外，结构化真实笔记的标注需要跨多个主题与子主题的精细组织，这对自动化生成流程的可靠性与人工校验的严谨性均提出了较高要求。

常用场景

经典使用场景

在人工智能驱动的定性研究领域，SparkMe-SyntheticUsers数据集为评估AI访谈系统的性能提供了标准化基准。该数据集通过模拟200名具有多样化人口统计学特征和职业背景的合成用户，构建了包含10个核心主题的结构化访谈笔记，这些主题涵盖了从工作职责到人工智能态度等多个维度。研究人员利用这些合成用户档案，能够系统性地测试访谈系统在覆盖度、涌现性和流畅性等指标上的表现，从而优化AI在深度访谈中的提问策略与交互逻辑。

衍生相关工作

围绕SparkMe-SyntheticUsers数据集，已衍生出一系列专注于提升AI访谈质量的研究工作。其核心关联工作SparkMe框架，提出了自适应半结构化访谈的方法，旨在平衡访谈的深度与广度。后续研究可能在此基础上，探索如何利用合成用户数据训练更精准的访谈代理，或开发新的评估指标以衡量访谈的语义深度与伦理合规性。这些工作共同推动了对话式AI在社会科学、人机交互与组织行为学等交叉学科中的应用边界。

数据集最近研究