JobNego; ResNego
收藏arXiv2026-04-20 更新2026-04-22 收录
下载链接:
https://github.com/kajareprajwal1143/PRISMA
下载链接
链接失效反馈官方服务:
资源简介:
JobNego和ResNego是由印度理工学院团队构建的创新型谈判对话数据集,分别聚焦工作面试和野营资源分配两大高价值场景。数据集通过ChatGPT生成初始语料,采用三阶段构建流程:首先生成包含任务角色和约束条件的105个工作面试场景及1,030个资源分配场景;其次定义12种情感类别和对应谈判策略;最后通过ENS-CoT机制生成带有情感推理链的对话。数据集创新性地标注了情感感知的谈判策略推理过程,为开发可解释的情感智能谈判系统提供关键训练资源,可应用于人机交互、心理咨询等高情感参与度领域。
JobNego and ResNego are innovative negotiation dialogue datasets constructed by a team from the Indian Institute of Technology, targeting two high-value scenarios: job interviews and camping resource allocation respectively. The datasets are developed via a three-stage construction pipeline, with the initial corpus generated by ChatGPT. The first stage generates 105 job interview scenarios and 1,030 resource allocation scenarios that include task roles and constraints; the second stage defines 12 emotion categories and their corresponding negotiation strategies; the third stage generates dialogues with emotion reasoning chains through the ENS-CoT mechanism. The datasets innovatively annotate emotion-aware negotiation strategy reasoning processes, offering key training resources for building interpretable emotion-aware intelligent negotiation systems, and can be applied to high-emotion-involvement fields such as human-computer interaction and psychological counseling.
提供机构:
印度理工学院帕特纳分校·计算机科学与工程系; 印度理工学院焦特布尔分校·人工智能与数据科学学院
创建时间:
2026-04-20
原始信息汇总
PRISMA 数据集概述
数据集基本信息
- 数据集名称:PRISMA 框架训练与评估数据集
- 数据格式:GSM8K JSONL 格式
- 内容类型:数学推理问题与解答(用于监督微调、偏好数据构建及奖励微调)
- 数据状态:包含样本数据集,完整数据集需申请获取
数据集获取
- 样本数据集:已包含在本代码仓库中。
- 完整数据集:需通过指定链接申请获取。
- 获取链接:https://ai-nlp-ml.github.io/resources.html
数据集在训练流程中的作用
数据集是 PRISMA 框架端到端训练与评估流程的核心组成部分,具体用于以下阶段:
1. 基础监督微调
- 输入数据:GSM8K 训练数据(
gsm8k/train.jsonl)。 - 用途:对预训练的 LLaMA 模型进行初始微调。
- 输出:微调后的模型权重(位于
/DPO-ST-P/dpo-st-cop/ft_models/llama-2/sft-0)。
2. 伪标签生成与偏好数据构建
- 输入数据:
- 基础 SFT 模型。
gsm8k/train.jsonl(黄金数据)。
- 生成过程:为每个训练样本生成多个(例如5个)伪标签解答。
- 中间输出:伪标签文件(如
model_outputs_nego_all/llama-2/sft-0/train/seed_{i}-t_0.7.json)。 - 最终产出:
- 初始 DPO 数据(
model_outputs_nego_all/llama-2/sft-0/train/train_dpo_data.jsonl)。 - 处理后的 DPO 训练/评估数据(
train_dpo_processed.jsonl,eval_dpo_processed.jsonl)。
- 初始 DPO 数据(
3. DPO 模型训练
- 输入数据:处理后的 DPO 训练与评估数据。
- 用途:训练直接偏好优化模型。
- 输出:DPO 训练后的 LLaMA 模型。
4. 奖励微调数据准备
- 输入数据:DPO 模型生成的伪标签数据(
train_dpo_data.jsonl)。 - 处理脚本:
utils/make_rft_data-1.py。 - 输出:RFT 训练数据集(
/model_outputs_nego_all/llama-2/dpo-1/train/train_rft_processed.jsonl)。
5. 最终监督微调
- 输入数据:由 RFT 处理流程生成的、包含标注数据和伪标签数据的混合数据集。
- 输出:最终微调模型。
6. 模型评估
- 评估数据:GSM8K 开发集(
gsm8k/dev.jsonl)和测试集(gsm8k/test.jsonl)。 - 评估流程:在最终模型上生成贪婪解码结果,并与黄金答案对比。
- 结果输出:评估结果保存于
results/llama-2.json。
关键文件路径摘要
- 训练数据:
gsm8k/train.jsonl - 评估数据:
gsm8k/dev.jsonl,gsm8k/test.jsonl - 基础 SFT 模型输出:
/DPO-ST-P/dpo-st-cop/ft_models/llama-2/sft-0 - SFT 伪标签输出:
model_outputs_nego_all/llama-2/sft-0/train/ - DPO 数据:
model_outputs_nego_all/llama-2/sft-0/train/train_dpo_data.jsonl - 处理后的 DPO 数据:
model_outputs_nego_all/llama2/sft-0/train/train_dpo_processed.jsonl,eval_dpo_processed.jsonl - DPO 模型伪标签输出:
model_outputs_nego_all/llama-2/dpo-1/train/ - RFT 训练数据:
/model_outputs_nego_all/llama-2/dpo-1/train/train_rft_processed.jsonl - 最终评估结果:
results/llama-2.json
搜集汇总
数据集介绍

构建方式
在情感智能谈判对话系统研究领域,构建高质量、可解释的数据集是推动模型发展的关键。JobNego与ResNego数据集的构建采用了基于ENS-CoT(情感感知谈判策略链式思维)推理机制的系统化方法。首先,研究团队从现有种子语料中生成多样化的谈判场景,涵盖职位面试与资源分配两大领域。随后,通过精心设计的提示模板,利用大型语言模型在少样本设置下合成对话,确保每个代理回合均附带完整的ENS-CoT标注,包括情感感知、理解、运用与管理四个维度的理性链条。整个过程经过多轮人工评估与过滤,保留在情感智能、策略适当性、可解释性等指标上达到高标准的对话,从而形成了规模适中、质量可控的标注数据集。
特点
JobNego与ResNego数据集的核心特点在于其深度融合了情感智能与可解释性。数据集不仅记录了谈判对话的原始文本,还为每一轮代理响应提供了结构化的ENS-CoT理性标注,清晰揭示了系统如何识别用户情感、分析其成因、转换思维视角并选择相应谈判策略的完整推理过程。这种设计使得数据集能够支持对情感感知谈判机制的透明化研究。此外,数据集覆盖了十二种情感类别与十二种情感感知谈判策略,确保了情感-策略组合的多样性与平衡性,同时对话在流畅度、连贯性与自然度上均表现出色,为训练可解释的情感智能谈判模型提供了坚实的数据基础。
使用方法
该数据集主要应用于训练与评估具备情感智能与可解释性的谈判对话系统。研究人员可利用其ENS-CoT标注进行监督式微调,使模型学习生成伴随理性链条的情感感知响应。进一步地,数据集支持偏好学习与自训练等进阶方法,例如通过对比正负样本优化模型输出,或利用未标注数据迭代提升性能。在评估阶段,数据集既可支持自动指标计算(如情感适当性、策略一致性),也可用于人工评估,检验模型在流畅性、谈判效能与结果公平性等方面的表现。因此,该数据集为开发如PRISMA等先进谈判代理提供了端到端的训练、验证与测试平台。
背景与挑战
背景概述
在情感计算与对话系统领域,情感智能与可解释性已成为构建可靠人机交互的核心议题。JobNego与ResNego数据集由印度理工学院帕特纳与焦特布尔校区的研究团队于2026年创建,旨在推动可解释情感智能谈判对话系统的发展。该数据集聚焦于两个高风险的谈判场景:求职面试与资源分配,通过引入情感感知谈判策略链式思维机制,为谈判代理提供了从情感感知到策略生成的透明推理路径。其构建不仅填补了情感智能谈判领域缺乏可解释数据资源的空白,也为基于大语言模型的谈判系统提供了高质量的标注语料,对促进人机谈判的可靠性、公平性与协作性具有重要影响。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,谈判对话需同时处理情感识别、策略选择与响应生成的多任务耦合,要求系统在动态交互中保持情感一致性与策略适应性,避免生成静态或脱离语境的回应。在构建过程中,大规模高质量对话数据的标注成本高昂,且需确保情感与策略标注的准确性与多样性;此外,基于提示的数据生成方法可能继承基础模型的偏见,并受限于生成内容的真实性与可控性,需通过人工验证与过滤来保证数据的公平性与自然度。
常用场景
经典使用场景
在情感智能对话系统领域,JobNego和ResNego数据集为研究提供了关键支撑。这些数据集通过模拟真实谈判场景,如求职面试和资源分配,系统化地标注了情感感知与策略推理链条。经典使用场景包括训练和评估具备情感解释能力的谈判代理,使其能够识别用户情绪、选择适配策略,并生成具有情感共鸣的回应。这些数据集常被用于验证情感链式思维(ENS-CoT)机制的有效性,推动对话系统在保持透明度的同时实现情感智能的深度融合。
实际应用
在实际应用层面,JobNego和ResNego数据集支撑了多个高价值场景的智能化升级。在人力资源领域,基于JobNego训练的谈判代理可辅助招聘人员进行薪酬协商,通过情感理解优化offer体验,提升候选人满意度与入职率。在资源管理场景中,ResNego驱动的系统能够协助团队或家庭进行物资分配谈判,平衡各方需求与情绪状态,促进协作共赢。这些应用不仅提升了谈判效率,还通过情感解释增强了用户对系统决策的信任,为教育、客服、冲突调解等需要复杂人际互动的领域提供了技术范式。
衍生相关工作
围绕JobNego和ResNego数据集,已衍生出一系列经典研究工作。PRISMA框架作为核心成果,首次整合了偏好强化自训练与直接偏好优化,显著提升了谈判代理的情感解释能力与响应质量。后续研究在此基础上扩展了多模态情感输入、跨文化谈判适应性以及动态策略演化模型。这些工作不仅深化了情感链式思维在对话生成中的应用,还推动了可解释人工智能与情感计算领域的交叉创新,为构建下一代具备社会智能的交互系统提供了理论支撑与实践工具。
以上内容由遇见数据集搜集并总结生成



