AgenticPay

Name: AgenticPay
Creator: 加州大学伯克利分校
Published: 2026-02-06 02:50:36
License: 暂无描述

arXiv2026-02-06 更新2026-02-08 收录

下载链接：

https://github.com/SafeRL-Lab/AgenticPay

下载链接

链接失效反馈

官方服务：

资源简介：

AgenticPay是由加州大学伯克利分校提出的多智能体自然语言谈判基准框架，包含110项任务，覆盖双边议价至多对多市场场景。该数据集模拟真实交易环境，整合买卖双方的私有约束与产品估值，通过多轮语言交互达成协议，支持可行性、效率及福利等结构化评估指标。其数据来源于10个商业领域的人工设计场景，旨在推动基于语言的自主智能体经济交互研究，解决现有基准在长期战略推理和市场复杂性建模上的不足。

提供机构：

加州大学伯克利分校

创建时间：

2026-02-06

原始信息汇总

AgenticPay 数据集概述

数据集基本信息

名称: AgenticPay
性质: 一个用于模拟买卖双方多智能体谈判的框架。
核心方法: 使用大型语言模型作为智能代理的基础，进行现实的价格谈判。
API设计: 采用类似Gymnasium的API，便于集成和扩展。

主要特性

基于LLM的智能体: 支持由LLM驱动的买方和卖方代理（目前支持OpenAI、vLLM和SGLang）。
多轮对话: 支持扩展的谈判对话。
记忆系统: 用于上下文感知谈判的对话历史管理。
状态跟踪: 全面跟踪价格、轮次和谈判状态。
灵活配置: 可自定义谈判参数和代理行为。
可扩展设计: 易于添加新的代理类型或LLM提供商。
环境注册系统: 类似Gymnasium的环境注册，便于环境管理。
多产品谈判: 支持在保持上下文的情况下谈判多种产品。
多智能体场景: 支持多种组合下的多个买家、卖家和产品。
并行与顺序谈判: 支持并行和顺序谈判模式。
用户画像: 影响代理谈判行为的个人偏好系统。

核心组件

环境

框架提供了一套全面的谈判环境，按复杂性组织：

单一买家 + 产品 + 卖家: 基础谈判场景。
仅多产品: 单个买家和卖家谈判多种产品的环境。
仅多卖家: 多个卖家与单个买家竞争的环境。
仅多买家: 多个买家竞争产品的环境。
多买家多卖家: 多个买家和多个卖家的复杂环境。
多产品多卖家: 多种产品和多个卖家的环境。
多买家多产品: 多个买家和多种产品的环境。
多买家多产品多卖家: 最复杂的环境，包含多个买家、产品和卖家。

通用环境方法:

reset(): 初始化新的谈判。
step(): 执行一个谈判回合（接受代理动作）。
render(): 显示当前谈判状态。
close(): 关闭环境并清理。

智能体

BaseAgent: 所有代理的抽象基类。
子类:
- BuyerAgent: 代表买方，根据用户需求和预算进行谈判。
- SellerAgent: 代表卖方，根据产品信息和市场条件进行谈判。

环境注册系统

类似Gymnasium的环境注册系统，便于环境管理。

关键函数: make(), register(), spec(), pprint_registry()。

ConversationMemory

管理对话历史和上下文。

功能: 带元数据的消息存储、历史检索（完整或最近）、基于角色的过滤。

配置

环境参数

max_rounds: 最大谈判轮数。
initial_seller_price: 卖方的起始价格。
buyer_max_price: 买方可接受的最高价格（保密）。
seller_min_price: 卖方可接受的最低价格（保密）。
price_tolerance: 达成协议的价格差异阈值。
environment_info: 上下文信息（天气、季节等）。
reward_weights: 控制不同奖励组件相对重要性的字典（包括buyer_savings、seller_profit、time_cost）。

代理配置

BuyerAgent: buyer_max_price（最高可接受购买价格）。
SellerAgent: seller_min_price（最低可接受销售价格）。

用户画像

用户描述在谈判初始化期间作为字符串传递给代理。

LLM配置

支持多种提供商：

本地模型: SGLangLM, VLLMLM（支持多GPU设置）。
OpenAI (API): OpenAILLM（需要API密钥）。
HuggingFace (本地/在线): HuggingFaceLLM（需要模型名称和设备）。

项目结构

AgenticPay/ ├── agenticpay/ │ ├── agents/ # 代理实现（买方、卖方） │ ├── envs/ # 环境实现 │ │ ├── single_buyer_product_seller/ # 基础谈判 │ │ ├── only_multi_products/ # 多产品场景 │ │ ├── only_multi_seller/ # 多卖家场景 │ │ ├── only_multi_buyer/ # 多买家场景 │ │ └── multi_*/ # 复杂多代理场景 │ ├── models/ # LLM实现（支持vLLM、SGLang、OpenAI API） │ ├── memory/ # 对话历史管理 │ ├── utils/ # 工具（状态、用户画像） │ └── examples/ # 按场景组织的示例脚本 ├── README.md ├── setup.py └── requirements.txt

安装与快速开始

安装: 创建Conda环境，安装依赖项和包。
模型下载: 从Hugging Face下载模型并保存到agenticpay/models/download_models目录以供本地模型使用。
快速开始: 运行示例脚本python agenticpay/examples/single_buyer_product_seller/Task1_basic_price_negotiation.py。

示例

示例按环境类别组织，涵盖从基础价格谈判到完整多代理场景的各种用例。

扩展性

框架设计为可扩展。关键扩展点包括：自定义奖励函数、高级价格提取、自定义谈判策略、基于学习的代理行为、额外的代理类型、自定义记忆系统。

许可证

MIT License

引用

bibtex @misc{agenticpay2025, title={AgenticPay: A Multi-Agent LLM Negotiation System for Buyer–Seller Transactions}, author={Xianyang Liu, Shangding Gu, Dawn Song}, year = {2025}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/SafeRL-Lab/AgenticPay}}, }

搜集汇总

数据集介绍

构建方式

在构建AgenticPay数据集时，研究团队设计了一个基于自然语言的多智能体买家-卖家谈判模拟框架。该框架通过定义包含私人约束和产品依赖估值的市场环境，将谈判形式化为一个有限回合的语言博弈。数据生成过程涉及超过110个任务，涵盖从双边议价到多对多市场的多种场景，每个任务均通过结构化动作解析器将对话映射为价格提议等经济行为，确保谈判结果的可评估性。

使用方法

使用AgenticPay数据集时，研究者可通过其统一的推理协议将不同的大型语言模型实例化为谈判智能体。每个模型在相同环境协议下扮演买家或卖家角色，依据系统提示接收公共产品信息与私人估值，并通过多轮对话生成谈判响应。评估过程采用全局分数、买家分数和卖家分数三项指标，综合衡量交易可行性、效率与福利分配，从而系统分析模型在长期战略规划、沟通协调及约束遵守等方面的能力差距。

背景与挑战

背景概述

随着大语言模型在自主代理领域的广泛应用，评估其在经济交互场景中的谈判与协调能力成为关键研究议题。AgenticPay数据集由加州大学伯克利分校的研究团队于2026年提出，旨在填补现有基准在自然语言驱动的多智能体买卖谈判评估方面的空白。该数据集通过模拟包含私有约束和产品依赖估值的市场环境，构建了从双边议价到多对多市场的110余项任务，为研究语言介导的战略交互、长期推理与经济福利分配提供了结构化实验平台。其引入的可行性、效率与福利度量体系，显著推动了智能体商务与基于语言的市场交互研究范式的演进。

当前挑战

AgenticPay致力于解决自然语言驱动多智能体谈判的评估挑战，核心在于衡量模型在复杂市场环境中进行长期战略推理与高效协商的能力。构建过程中的主要挑战体现在多维任务设计上：需在保持谈判协议一致性的前提下，系统化扩展买方、卖方与产品集的组合复杂度；同时需设计能够准确映射对话历史到结构化经济行动（如价格提议）的解析机制，并建立兼顾交易可行性、效率与各方福利的评估指标。此外，模拟真实商业场景时还需平衡任务多样性与环境可控性，确保基准既能反映现实交易的异质性，又支持可复现的实验分析。

常用场景

经典使用场景

在智能体经济学与多智能体系统研究领域，AgenticPay数据集被广泛用于评估基于大语言模型的自主谈判代理在多样化市场环境中的表现。该数据集通过模拟从双边议价到多对多市场的复杂交易场景，为研究者提供了一个标准化的测试平台，用以分析智能体在语言媒介下的战略推理、沟通协调与长期规划能力。其经典使用场景包括对比不同LLM模型在买方与卖方角色中的谈判效率，以及探索市场结构变化对交易结果的影响。

解决学术问题

AgenticPay数据集有效解决了现有基准在评估语言媒介经济交互方面的不足，传统研究往往局限于数值竞价或短期双边谈判，难以捕捉真实交易中的私有约束、多轮谈判与异构产品等关键特性。该数据集通过形式化语言谈判博弈，引入基于可行性、效率与福利的量化指标，为研究多智能体协调、经济对齐以及语言与战略协同进化等前沿问题提供了坚实基础，推动了自主谈判智能体的科学评估与理论发展。

实际应用

在现实世界中，AgenticPay数据集的应用潜力体现在电子商务、采购谈判与服务合约等多个经济场景。其模拟的十个商业领域，涵盖消费品、专业服务、供应链与金融资产，能够帮助开发更智能的自动化谈判系统，提升交易效率与公平性。例如，在在线市场平台中，基于该数据集训练的代理可协助用户进行价格协商，或在企业采购中优化供应商选择与合同条款，从而降低交易成本并改善市场流动性。

数据集最近研究