1. 产品动态
OpenAI / ChatGPT:面向 Free & Go 用户开启内嵌广告测试
- 变化点:OpenAI 在 2 月 9 日的 ChatGPT 发布说明中宣布,开始向美国地区已登录的 Free 与 Go 用户灰度测试对话内广告;广告以“Sponsored”区块形式展示在回答下方,且不嵌入模型输出文本本身,敏感领域(健康、政治等)和未成年人会被排除在投放之外。(help.openai.com)
- 影响:这是首个主流对话式 LLM 正式上线的系统级广告位,未来有望演进为“LLM 原生广告”流量入口;短期内广告主需关注其定向粒度(基于当前对话上下文而非长期画像)、品牌安全约束以及与搜索广告、信息流广告的预算协调。
Google Ads:发布 Google Ads API v23.1,强化合规与创意控制
- 变化点:Google 在 2 月 25 日发布 Google Ads API v23.1,小版本为非破坏式升级,引入 EU 政治广告合规字段(如
Campaign.missing_eu_political_advertising_declaration、Customer.contains_eu_political_advertising)、新的视频上传服务YouTubeVideoUploadService,并在Campaign对象上增加“文本指南(text guidelines)”以程序化约束 AI 生成文案,同时新增多档“去重触达用户数”频次指标(unique_users_two_plus等)。(ads-developers.googleblog.com) - 影响:对国内外代理商和工具商而言,一方面需要在 2026 年内完成版本迁移(v19 已于 2 月 11 日下线),另一方面可利用文本指南字段在 PMAX / Search 中“软约束”AI 资产生成,降低品牌风险、提升多语言自动创意质量。
- 变化点:Google 在 2 月 25 日发布 Google Ads API v23.1,小版本为非破坏式升级,引入 EU 政治广告合规字段(如
Meta:Graph / Marketing API v25.0 推出,度量体系由 Reach 向 Views 收敛
- 变化点:2 月中下旬,Meta 正式面向开发者推出 Graph API 与 Marketing API v25.0,宣布将逐步废弃 Page/Post Reach、Video Impressions、Story Impressions 等“到达/展示”类旧指标,统一收敛为 Media Views / Media Viewers,并在 Ads Insights Async API 中新增结构化错误字段(
error_code、error_user_msg等)提升诊断能力。(mobilemarketingreads.com) - 影响:第三方监测平台和内部 BI 仪表盘需要在上半年完成指标体系迁移,否则历史报表前后口径将出现断层;同时,异步报表错误信息更细化,便于构建自动告警与重试机制,减少大规模报表任务“悄然失败”的风险。
- 变化点:2 月中下旬,Meta 正式面向开发者推出 Graph API 与 Marketing API v25.0,宣布将逐步废弃 Page/Post Reach、Video Impressions、Story Impressions 等“到达/展示”类旧指标,统一收敛为 Media Views / Media Viewers,并在 Ads Insights Async API 中新增结构化错误字段(
巨量引擎:2026 年 Q1 IAP 抖小激励政策上线,深推小游戏变现
- 变化点:巨量引擎于 2 月 3 日发布《2026 年 Q1 IAP 抖小激励政策》,在 2 月 1 日–3 月 31 日期间,对符合条件的内购类抖音小游戏提供最高 40% 现金消耗赠款,单款封顶 400 万元,覆盖新游与老游,联动“投放赠款+同发扶持+新游测出”等环节。(36kr.com)
- 影响:对于买量团队,这是在信息流+小程序内 IAP 的一次“政策性杠杆”;短期可以通过拉高预算、配合激励视频与直播挂载,快速做 ROI 试探,但需评估激励退坡后真实 LTV,避免“补贴红利”阶段形成不可持续的出价策略。
2. 论文
《Enhancing Bandit Algorithms with LLMs for Time-varying User Preferences in Streaming Recommendations》(arxiv.org)
- 作者及单位:Chenglei Shen, Yi Zhan, Weijie Yu, Xiao Zhang, Jun Xu;作者主要来自中国人民大学高瓴人工智能学院 Intelligent Information Retrieval Lab 等机构。
- 发表时间:2026-02-08(arXiv:2602.08067)。
- 核心问题:流式推荐中用户兴趣随时间变化,传统 bandit 方法仅将时间当作时间戳,既难以刻画“时间-兴趣”的关联,又在早期在线阶段探索效率低。
- 核心方法:提出 HyperBandit+:
- 用 时间感知 hypernetwork 生成 bandit 模型参数,显式建模时间特征与用户偏好的映射;
- 设计 LLM Start 机制,通过 LLM 生成多步交互数据进行离线预热,作为 bandit 的 warm-start 参数;
- 结合低秩分解降低 hypernetwork 训练复杂度,并给出了同时考虑 hypernetwork 与 LLM warm-start 的次线性遗憾上界。
- 关键结果:在多组真实流式推荐数据上,HyperBandit+ 在累积收益指标上显著优于现有 bandit 基线,证明“时间-aware + LLM 预热”对冷启动和非平稳偏好的有效性。
- 落地启示:对有长时交互链路(长视频、直播、电商 feed)的推荐/广告系统,可以:
- 在现有 bandit / UCB 框架外,加一层时间超网络做“日/周节律 + 活动窗口”的参数调制;
- 用 LLM 基于日志做“对话式补全”合成用户-物料交互,用于 warm-start 小流量新频道、新策略,而不直接上真实流量。
《Autobidding Equilibria in Sponsored Shopping》(arxiv.org)
- 作者及单位:Paul Dütting, Renato Paes Leme, Yuhao Li, Kelly Spendlove, Yifeng Teng;多位作者长期就职于 Google Research 等机构,论文相关报告亦由 Google Research 的 Yifeng Teng 在北大 CFCS 青年论坛分享。(cfcs.pku.edu.cn)
- 发表时间:2026-02-25(arXiv:2602.21966)。
- 核心问题:在 Sponsored Shopping 场景下,同一广告主面对“多商品、多广告位”的组合拍卖,其通过 autobidder(统一出价+ROI 约束) 参与 GSP/VCG 机制时,是否存在稳定均衡?效率与激励性质如何?
- 核心方法:
- 建模多商品、多位次的组合分配问题,在 ROI 约束下刻画 uniform autobidding 策略 的可行集合;
- 在 GSP 与 VCG 两种常见机制下,证明 Autobidding Equilibrium 的普遍存在;
- 分析在该均衡下的 Price of Anarchy = 2(紧界),即福利最差情况下仍为最优社会福利的一半。
- 关键结果:论文给出“在合理假设下,平台可以放心让广告主用 ROI autobidder 玩组合购物广告,机制在效率和稳定性上可控”的理论保证。
- 落地启示:
- 对电商广告平台(购物广告、商品卡片推荐+广告混排),该结果支持继续推行统一出价+预算/ROI 约束的自动出价,而不用为“多商品多位次”结构单独设计极复杂机制;
- 平台仍需在实际系统中监控长尾商品曝光与 welfare 分布,避免理论界限附近的极端情况(如部分广告主以极高出价垄断多个位次)。
《From No-Regret to Strategically Robust Learning in Repeated Auctions》(arxiv.org)
- 作者及单位:Junyao Zhao,FSMP 博士后,隶属 IRIF(CNRS & Université Paris Cité)。(junyao-zhao.github.io)
- 版本更新时间:v2 修订于 2026-02-09(arXiv:2601.03853)。
- 核心问题:在重复的一价/多种单品拍卖中,投标人使用 无悔学习算法 调整出价策略时,能否保证“拍卖方收入不会超过 Myerson 最优机制”,即 学习过程在机制意义上是“可控”的?
- 核心方法:
- 将单调出价策略表示为分位数空间上的区间划分,并构造与真实机制配对的“辅助拍卖”;
- 证明:若每个投标人对其“分位策略”采用任何无悔算法(如 MWU、OGD 等),则拍卖方期望总收入与 Myerson 最优收入之差由总 regret 上界;
- 由此可将 regret → 战略稳健性:只要每个学习器的 regret 为 o(T),拍卖方的平均收入不可能长期超过 Myerson 最优。
- 关键结果:证明了 任意无悔算法 + 满足单调分配和自愿参与的拍卖族,均可获得“收入不超 Myerson”的上界;尤其是常用的 Multiplicative Weights Update (MWU) 同时实现最优 regret 和最强已知的战略稳健性。
- 落地启示:
- 对已在广告平台中大量部署的“learning bidder / smart bidding”而言,该结果为“允许广告主运行自己的学习出价器”提供了安全边界:平台收入不会因学习算法而异常放大。
- 对平台内部的 RL / bandit 出价器设计,可更多关注 regret 指标,并在满足单调性与 IR 的机制族内放心演化,而无需额外引入复杂的“反操纵”约束。
3. 技术文章
阿里妈妈技术:《ABPlanner:基于 Few‑Shot 的个性化自动出价模型》(2026-02-06)(hub.baai.ac.cn)
- 核心观点:在预算约束自动出价场景下,单一层级的出价器很难同时适配不同广告主、又保持样本效率;应当用 分层出价框架 + 少样本自适应预算规划器(ABPlanner),在“预算规划层”上做个性化学习。
- 技术方案:
- 将一天或一轮投放拆成多个阶段(按时段/曝光量),高层 Budget Planner 负责在阶段间分配预算,底层出价器在阶段内执行;
- 将 Budget Planner 建模为 MDP,通过 PPO 等深度强化学习算法,在“每轮一次决策”的低频空间内学习预算调整策略;
- 利用历史回合数据作为“提示(prompt)”,实现 few-shot 适配新广告主;
- 线上 A/B 显示:在不改动底层出价器的前提下,累计展示价值与转化数显著提升,并在部分天数中实现成本下降。
- 可借鉴要点:
- 对已有“统一 auto-bidder”的平台,可以优先在 预算分配层 实验 ABPlanner,而不用立即重写出价器;
- 强调“阶段化视角”和“跨回合提示”,对接类似预算排期或日内节奏控制的业务非常契合。
- 结合其 KDD’25 论文,可在离线仿真环境中先做策略评估,再逐步上线。
Amazon Ads:《The precision revolution: How AI helps eliminate advertising complexity》(2026-02-04)(advertising.amazon.com)
- 核心观点:广告行业正在从“经验 + 手工调参”迈向“AI 驱动的精确化运营”,关键不在于再堆工具,而是用 AI 接管操作复杂度,让人只做“目标与创意的决策”。
- 技术方案 / 工具组合:
- Creative Agent:基于品牌店铺与商品详情自动生成多格式创意,用对话式接口产出可直接投放的 Streaming TV、视频、展示广告素材;
- Ads Agent:以自然语言接口创建、优化与分析广告活动,实现“说出目标 → 生成全漏斗方案”的工作流;
- Full-Funnel Campaigns(Q1 计划上线):支持通过 NL 直接编排从认知到转化的全漏斗活动,由 AI 自动完成定向、出价和跨格式优化。
- 可借鉴要点:
- 对自建投放平台,可对标其“三层栈”:创意生成 Agent → 活动编排 Agent → 自动优化引擎,将 PM 人力从素材与结构配置中解放出来;
- 强调“Glass Box”而非 Black Box:即使由 AI 负责优化,也要在 UI 中清晰呈现受众特征、投放分布和贡献度,便于运营与品牌方理解和干预。
Viacheslav Yurenko:《Meta Updates Graph API and Marketing API to v25.0: What Businesses Need to Know》(LinkedIn,2026-02-22)(linkedin.com)
- 核心观点:Meta v25.0 不是简单的 API 小升级,而是围绕 统一度量(views)、Advantage+ 自动化与 API 简化 的一次结构性调整,需要把它当作“广告系统现代化项目”而非“合规打补丁”。
- 技术解析:
- 度量统一:Reach / Impressions / 3s views 等旧指标将在 2026 年中前后退场,API 层面全面迁移到 Media Views / Media Viewers;
- 自动化默认化:Marketing API v25.0 推动 Advantage+ 成为主流配置方式,旧有非 ODAX / 非 Automation Unification 配置将被逐步废弃;
- 基础设施变更:包括 Webhooks mTLS 证书更换、Ads Insights Async API 错误结构细化、
metadata=1等遗留参数弃用。
- 可借鉴要点:
- 对依赖 Meta API 的行业工具与内部系统,需要建立 API 治理机制:版本跟踪、定期集成审计、迁移路线图;
- 在业务侧,应同步调整 KPI 口径,将“views”作为跨 FB/IG 的统一上层度量,并重构可视化报表和历史对比逻辑;
- 对投放团队,要从“精细手工 audience 结构设计”转向“目标设定+创意+数据质量”的三件事,其余交给 Advantage+ 与平台算法。
4. 本期可执行行动清单
行动 1:建立跨平台 API & 度量升级路线图(Meta v25.0 + Google Ads v23.x + ChatGPT Ads)
- 适用场景:
- 使用 Google Ads / Meta Ads / 其他社交平台 API 自建投放或报表系统的广告主、代理商与 SaaS 工具商。
- 落地路径:
- 能力盘点(1–2 周)
- 列出当前使用的所有广告 API 版本与依赖字段(Google Ads v19/v20/v21/v22/v23;Meta Marketing API v23/v24 等),标注哪些在 2026 年内有 sunset / 废弃风险。(ads-developers.googleblog.com)
- 盘点内部报表、归因与风控系统中对 Meta Reach/Impression、Google 旧指标的使用点。
- 设计统一度量与治理规范(2–4 周)
- 定义统一的 “views-based” 上层指标(含去重与多频段指标),并映射到各平台的新字段(Meta Media Views、Google v23+ 新频次指标等)。(mobilemarketingreads.com)
- 引入 API 版本管理(如每季度审查、预设迁移时间窗)与 错误治理机制(利用 Meta Ads Insights Async 新错误字段自动重试 & 告警)。(web.swipeinsight.app)
- 小范围迁移试点(1–2 个月)
- 选取 1–2 条业务线或 1–2 个大客户,率先迁移至 Google Ads v23.1、适配 Meta v25.0;
- 同步接入 ChatGPT Ads 相关数据(若投放),评估其在品牌搜索、长尾问答场景下的增量价值。(help.openai.com)
- 全面推广与文档固化(Q2–Q3)
- 将迁移经验沉淀为内部“广告 API 变更 SOP”,包括测试用例、回滚策略与业务沟通模板。
- 能力盘点(1–2 周)
- 潜在风险 / 注意事项:
- Meta 旧指标退场期间,历史数据对比会出现“断档”,需要通过回溯映射或并行报表解决;
- Google Ads API 版本切换时,要特别关注 v19 下线前后的数据完整性与 attribution lag 对报表的短期扰动。(ppc.land)
行动 2:在自有投放与推荐系统中试点“分层预算规划 + LLM 预热 Bandit”
- 适用场景:
- 拥有自研自动出价器 / 推荐 ranker 的大型平台或广告主(电商、游戏、内容平台),希望提升预算利用效率与冷启动表现。
- 落地路径:
- 问题选择与数据准备(2–3 周)
- 在一个相对独立的广告产品(如小游戏投放、某电商频道、信息流广告位)中,选取“预算约束 + 长时段投放”的场景作为试点。
- 抽取至少 30–60 天的历史日志,构建离线仿真环境(可借鉴 ABPlanner 与 HyperBandit 的做法)。(hub.baai.ac.cn)
- 分层框架 PoC(1–2 个月)
- 复刻 ABPlanner 思路:
- 上层:Budget Planner(阶段化预算分配,状态包括历史消耗与收益);
- 下层:保持现有 auto-bidder / ranker,不做大改动。
- 在仿真中以 PPO / DQN 等方法训练 Budget Planner,对比均分预算、简单 heuristic 等基线。(hub.baai.ac.cn)
- 复刻 ABPlanner 思路:
- 引入 LLM 预热的 Bandit/策略(可选,1–2 个月)
- 对于推荐 / creative 选择问题,可基于 HyperBandit+ 思路,引入时间感知 hypernetwork + LLM 合成轨迹,做在线策略的 warm-start;
- LLM 只在离线阶段使用,用于生成“合理但未发生”的交互样本,减少真流量冷启动损耗。(arxiv.org)
- 小流量在线实验与分阶段放量(持续 1–3 个月)
- 先将 1–5% 流量切换至“分层预算 + 预热策略”,监控 ROI、消耗稳定性和用户体验指标;
- 若在多轮节假日/大促中保持稳定收益,再扩展到更多广告主与频道。
- 问题选择与数据准备(2–3 周)
- 潜在风险 / 注意事项:
- 分层规划与底层出价器的优化目标需对齐,否则可能出现“预算规划器追求短期 ROI,出价器追求长期价值”的冲突;
- LLM 合成数据若分布偏离真实业务,可能导致策略在上线初期出现过度自信或错误探索,需要通过严格的 offline evaluation 和 conservative 策略部署(如限制学习率、加安全约束)予以缓冲。
5. 论文与链接列表
5.1 本期涉及论文
Enhancing Bandit Algorithms with LLMs for Time-varying User Preferences in Streaming Recommendations
- arXiv:2602.08067 (arxiv.org)
Autobidding Equilibria in Sponsored Shopping
- arXiv:2602.21966 (arxiv.org)
From No-Regret to Strategically Robust Learning in Repeated Auctions
- arXiv:2601.03853(v2 修订于 2026-02-09)(arxiv.org)
An Adaptable Budget Planner for Enhancing Budget-Constrained Auto-Bidding in Online Advertising(对应 ABPlanner,KDD’25 ADS Track)
- arXiv:2502.05187 (arxiv.org)
HyperBandit: Contextual Bandit with Hypernetwork for Time-Varying User Preferences in Streaming Recommendation(HyperBandit 早期工作,为 HyperBandit+ 奠定基础)
- arXiv:2308.08497 (arxiv.org)
5.2 产品 / 技术 / 资讯链接
OpenAI ChatGPT 发布说明:ChatGPT Ads 测试
- ChatGPT — Release Notes(2026-02-09)(help.openai.com)
- Search Engine Land:《OpenAI starts testing ChatGPT ads》(2026-02-09)(searchengineland.com)
Google Ads
- Google Ads Developer Blog:《Announcing v23.1 of the Google Ads API》(2026-02-25)(ads-developers.googleblog.com)
- PPC Land:《Google Ads API shifts to monthly releases starting January 2026》(ppc.land)
- SKU Analyzer:《Google Ads API v23: Complete Guide to the January 2026 Update》(skuanalyzer.com)
Meta / Facebook
- Social Media Today / Yahoo:《Meta Updates Marketing API to Align With Latest Ad Shifts》(解读 Graph / Marketing API v25.0 与 views 统一度量)(tech.yahoo.com)
- Releasebot:《Graph API by Meta – Release Notes》(汇总 Graph / Marketing API 更新)(releasebot.io)
- LinkedIn:Viacheslav Yurenko,《Meta Updates Graph API and Marketing API to v25.0: What Businesses Need to Know》(2026-02-22)(linkedin.com)
- Swipe Insight:Meta For Developers 源摘要(含 Ads Insights Async API 错误字段更新)(web.swipeinsight.app)
Amazon Ads
- Amazon Ads Expert Advice:《The precision revolution: How AI helps eliminate advertising complexity》(2026-02-04)(advertising.amazon.com)
- Amazon Ads News:《2025 Amazon China Seller Conference: Amazon Ads showcases innovations and announcements》(2026-02-17,介绍 Ads Agent、Creative Agent、Sponsored Products prompts 等工具)(advertising.amazon.com)
巨量引擎 / 字节系
- 36 氪:巨量引擎《2026 年 Q1 IAP 抖小激励政策》新闻(2026-02-03)(36kr.com)
阿里妈妈 / 智源社区
- 智源社区:阿里妈妈技术,《ABPlanner:基于 Few‑Shot 的个性化自动出价模型》(2026-02-06)(hub.baai.ac.cn)
Autobidding Equilibria 相关资讯
- arXiv:Autobidding Equilibria in Sponsored Shopping(2602.21966)(arxiv.org)
- 北京大学前沿计算研究中心:CFCS Youth Talks – Autobidding Equilibria in Sponsored Shopping(报告人:Dr. Yifeng Teng, Google Research)(cfcs.pku.edu.cn)
HyperBandit+ 作者信息
- Chenglei Shen 个人主页(Gaoling School of AI, Renmin University of China, IIR Lab)(starrylay.github.io)
From No-Regret… 作者信息与解读
- Junyao Zhao 个人主页(IRIF, CNRS & Université Paris Cité)(junyao-zhao.github.io)
- Chatpaper / The Moonlight 论文解读页(用于确认单位与技术要点)(chatpaper.com)
注:如需进一步落地上述方案,建议优先阅读原论文与官方文档,以获取完整技术细节与最新变更。若内部实现遇到具体工程或实验设计问题,可以在下一个周期聚焦某一条专题做深研。