BAT: Benchmark for Auto-bidding Task

Name: BAT: Benchmark for Auto-bidding Task
Creator: 俄罗斯科学院列别捷夫物理研究所
Published: 2025-05-13 20:12:34
License: 暂无描述

arXiv2025-05-13 更新2025-05-15 收录

下载链接：

https://github.com/avito-tech/bat-autobidding-benchmark, https://doi.org/10.5281/zenodo.14794182

下载链接

链接失效反馈

官方服务：

资源简介：

BAT数据集是针对在线广告自动竞价任务设计的基准数据集，包含来自Avito平台的一百万次VCG拍卖和一千万次FP拍卖的数据。该数据集旨在支持自动竞价算法的开发和评估，数据集内容涵盖广告活动的参数、拍卖结果和流量数据。数据集的创建涉及数据收集、过滤和抽样过程，确保了数据的质量和代表性。该数据集为研究人员和实践者提供了友好的开发框架，有助于推动程序化广告领域的创新算法开发。

The BAT Dataset is a benchmark dataset tailored for the automated bidding task in online advertising. It comprises data from one million VCG auctions and ten million FP auctions sourced from the Avito platform. This dataset is designed to support the development and evaluation of automated bidding algorithms, covering parameters of advertising campaigns, auction outcomes, and traffic data. The dataset creation process involves data collection, filtering, and sampling procedures, which guarantee its data quality and representativeness. This dataset provides a user-friendly development framework for both researchers and practitioners, and facilitates the advancement of innovative algorithm development in the field of programmatic advertising.

提供机构：

俄罗斯科学院列别捷夫物理研究所

创建时间：

2025-05-13

搜集汇总

数据集介绍

构建方式

BAT数据集构建过程基于Avito平台的实际广告拍卖数据，包含两种主流拍卖类型（VCG和FP）的详细记录。数据采集于2024年3月至8月期间，通过聚合搜索广告和真实广告活动的拍卖结果形成。每个广告活动的参与结果（包括竞标输赢、对应出价、点击率、转化率及拍卖位置）按价格区间和时间段（1小时粒度）进行聚合，并通过计算当前价格区间与前一区间关键参数的差值生成增量字段。数据集经过严格过滤，确保统计周期完整覆盖广告活动生命周期，并剔除异常或重复条目，最终形成包含2500个VCG样本和9000个FP样本的高质量数据集。

特点

BAT数据集的核心价值体现在其多维度的广告生态刻画能力：包含10百万次FP拍卖和1百万次VCG拍卖的详细日志，覆盖9000余广告主跨21天的活动轨迹。数据字段设计极具实践指导性，除基础拍卖指标外，创新性地引入基于价格区间的增量可见性、点击量及预算消耗等动态特征，并整合地域流量分布、广告位平台偏好等上下文信息。特别值得注意的是，数据集通过逻辑分类体系（如1.2对应Cars.Ferrari）保留商品类目特性，且同时包含胜败方数据以支持完整归因分析，为算法验证提供接近真实商业环境的测试基准。

使用方法

该数据集支持程序化广告算法的全流程开发验证：研究者可通过模拟器加载活动参数（预算、生命周期）和实时流量数据，在逐时间戳的竞标决策中接收包含消耗、增量点击等反馈。典型应用场景包括预算平滑实验（通过RMSE指标评估支出均匀性）、CPC约束优化（比较实际与目标单次点击成本）以及点击总量最大化测试。数据集特别设计训练集（A1）与验证集（A2）的时间隔离划分，建议采用贝叶斯优化框架（如Optuna）在A1调参后于A2验证，确保评估可靠性。配套开源的ALM、TA-PID等基线算法，为研究提供可复现的参照体系。

背景与挑战

背景概述

BAT（Benchmark for Auto-bidding Task）数据集由俄罗斯Avito公司联合莫斯科物理技术学院和莫斯科国立大学的研究团队于2025年创建，旨在解决程序化广告领域实时竞价（RTB）算法的评估标准缺失问题。该数据集收录了1000万次第一价格拍卖（FP）和100万次VCG拍卖的详细日志，覆盖9000多个广告主在21天内的交易数据，包含点击率预测、转化率统计及流量分布等关键维度。作为首个同时支持两种主流拍卖机制的开放基准，BAT通过提供标准化评估框架显著推动了自动出价算法的研究进程，其多维度数据特性为预算 pacing 和成本控制等核心问题提供了新的研究范式。

当前挑战

该数据集主要面临双重挑战：在领域问题层面，需解决实时竞价中预算分配不均匀与点击成本约束优化的复杂平衡问题，传统算法难以适应动态拍卖环境下的多目标优化；在构建过程中，数据采集面临广告平台商业敏感信息的匿名化处理难题，且需精确聚合不同价格区间的边际效益指标（如AuctionWinBidSurplus）。此外，VCG与FP拍卖机制的异构数据结构整合、流量时序特征的标准化表达，以及冷启动广告活动的基线建模，均为数据集构建的关键技术瓶颈。

常用场景

经典使用场景

BAT数据集作为在线广告自动竞价领域的基准测试工具，其经典应用场景聚焦于模拟真实世界的第一价格（FP）和VCG拍卖环境。研究者通过加载包含千万级拍卖日志的标准化数据，能够复现广告平台流量分布、预算消耗曲线等核心要素，尤其适用于验证预算平滑算法在不同拍卖机制下的表现。例如在VCG拍卖中模拟长尾流量时段的竞价策略调整，或在FP拍卖中测试基于实时点击率预测的动态出价模型。

衍生相关工作

该数据集已催生多个标志性研究：1）基于其流量特征改进的M-PID算法成为预算平滑的新基线；2）衍生的BROI算法首次实现ROI约束下的理论性能保证；3）Mystique等工业级算法通过BAT验证了跨拍卖机制的泛化能力。相关成果发表在WWW、KDD等顶会，其中ALM算法框架已被扩展应用于多智能体竞价博弈场景。

数据集最近研究