aixpilot.com

Pilot Your Work with AI

浏览每日/每周/每月的广告与 AI 洞察报告,掌握行业动向

← 返回首页
AI日报

AI日报 - 2026-03-23

📅 周期:2026-03-23 ~ 2026-03-23

📝 字数:13421 字

⏰ 生成时间:2026-03-24 05:35:36 CST

统计时间:截至北京时间 2026-03-23 23:59,覆盖 3 月中下旬已公开的重要进展。


1)模型 / 平台

  1. OpenAI 发布旗舰模型 GPT‑5.4,面向“专业工作 + Agent”场景全面升级

    • 变化点:3 月 5 日 OpenAI 正式上线 GPT‑5.4(含 Thinking / Pro 两个变体),在 ChatGPT、API 与 Codex 全面可用,支持最高 100 万 token 上下文、本地/网页桌面操作(computer use)、工具搜索、长链路知识工作与编码任务,GDPval 基准上在 83% 的职业任务上达到或超过专业人士水平。(openai.com)
    • 影响:对广告 / 搜索 / 推荐业务而言,这是目前最偏 “执行层” 的通用模型之一,适合承担跨系统操作型 Agent(批量生成投放方案、跑报表、调参数)和复杂长文档理解(商品库、合同、营销规划),可以显著减少业务团队中的“低阶体力活”。
  2. OpenAI 推出 GPT‑5.4 mini / nano:为子 Agent 和高频调用场景做的“小钢炮”

    • 变化点:3 月 17 日官方发布 GPT‑5.4 mini / nano,在编码、推理、多模态工具调用等维度接近或逼近大号 GPT‑5.4,但延迟更低、成本更小;mini 支持 40 万上下文、全套工具(搜索、文件、computer use、技能),在 SWE‑Bench Pro、OSWorld-Verified 等基准上明显优于 GPT‑5 mini。(openai.com)
    • 影响:这类“小但强”的模型非常适合作为推荐/搜索系统中的 子 Agent(如候选生成、局部重排、特征填补)、创意生成流水线中的快速打稿模型,配合大模型做最终决策,可在不大幅增加算力的前提下提升系统智能化程度。
  3. OpenAI 宣布收购 Astral,加强 Codex 与 Python 工具链一体化

    • 变化点:3 月 19 日 OpenAI 宣布拟收购开源 Python 工具厂商 Astral(uv、Ruff、ty 等工具的维护方),并将其团队并入 Codex 团队,目标是让 AI 直接在开发者常用的依赖管理、Lint、类型检查工具链中工作,而不是只“生成代码片段”。(openai.com)
    • 影响:对电商技术团队来说,意味着 AI 编码助手 → AI DevOps / 工程 Agent 的演进会加速:未来广告 / 推荐的特征工程、实验配置、数据校验、上线发布都可以更多交给 Codex + 工具链代理自动完成,降低研发与运维成本。
  4. Google 推出图像模型 Nano Banana 2(Gemini 3.1 Flash Image),主打“快 + 4A 级创意质量”

    • 变化点:Google 在 2 月 26 日发布 Nano Banana 2(Gemini 3.1 Flash Image),将原 Pro 级图像模型的世界知识、文本渲染、多语言翻译与 4K 图像质量下放到 Flash 速度,已在 Gemini App、Google 搜索与广告等产品中逐步默认启用。(blog.google)
    • 影响:这进一步降低了 高质量广告创意 / 商品图 / 信息流封面 的生成门槛,且对海量 A/B 创意实验尤其友好——在 Google Ads 生态做出量、跨语种落地的成本会继续下降,本地业务可参考其能力规划自家多模态创意平台。
  5. 小米发布 MiMo 系列大模型,并宣布三年 600 亿元 AI 投入

    • 变化点:3 月 19 日雷军在小米春季发布会上宣布推出三款 MiMo 系列模型:MiMo‑V2‑Pro(面向 Agent 时代的旗舰基座)、V2‑Omni(全模态大模型)、V2‑TTS(语音大模型),并计划未来三年在 AI 领域至少投入 600 亿元人民币;此前匿名上线 OpenRouter 一周即登顶日榜、周榜。(zh.wikipedia.org)
    • 影响:国内生态里,MiMo 把“面向 Agent”的定位写在产品名里,且已在 API 聚合平台上被全球开发者验证,对想做 本土化 Agent、电商内容/客服/私域助手 的团队,是除 DeepSeek 之外值得重点跟踪和对标的国产开源路线。
  6. 腾讯将 OpenClaw Agent 深度接入微信,推出 ClawBot 插件

    • 变化点:3 月 22 日,微信发布 “clawbot” 插件,用户可在微信聊天界面直接调用开源 Agent 框架 OpenClaw;此前 3 月 6 日多家国内云厂商已上线 OpenClaw 一键部署服务,全国多地也围绕“养龙虾”(OpenClaw 部署与应用)出台扶持政策。(zh.wikipedia.org)
    • 影响:微信作为超级入口叠加开源 Agent,意味着 基于 IM 的企业运营 / 电商客服 / 店小二 / 内容分发 可以快速被 Agent 化;对平台方而言,如何在微信生态中把 OpenClaw 这类自主 Agent 接入 CRM、商品体系与风控体系,将直接影响获客与运营效率。

2)机器人 / 系统

  1. 人形机器人被正式写入国内“新质生产力”与两会议程,强调数据与制度基础设施建设

    • 变化点:围绕 2026 全国两会,多篇研报与媒体梳理指出:政府工作报告已将 具身智能 / 人形机器人 纳入未来产业重点方向,并提出需完善工业数据基础设施、数据标准与跨区域“AI 制度创新试点”(如粤港澳大湾区),支撑人形机器人规模化商用;TrendForce 预计 2026 年全球人形机器人出货量突破 5 万台,同比增幅约 700%。(ithome.com)
    • 影响:这为 仓储物流机器人、线下导购 / 数字人形象、生产线协作机器人 的长期部署提供政策托底,电商平台和大仓运营可以更积极推进“机器人 x 大模型”在拣选、分拣、质检环节的试点。
  2. AGIBOT 在 MWC 2026 推出 Robot‑as‑a‑Service(RaaS)短租平台

    • 变化点:中国 AGIBOT 在巴塞罗那 MWC 2026 上发布人形机器人 RaaS 平台,在 17 个国家提供日租价格从 899 欧元起的人形机器人短期租赁,用于展会、零售导览、活动运营等场景。(abit.ee)
    • 影响:RaaS 降低了实体业务尝试人形机器人 + 大模型的门槛,线下门店、品牌快闪活动、沉浸式展厅 可以以“项目制租用”的方式评估 ROI,再决定是否重资产自建。
  3. Nvidia 支持的 Figure、以及小鹏 IRON 机器人推动人形机器人向规模量产迈进

    • 变化点:近期报道显示,Nvidia 投资的 Figure 在人形机器人自主操作上继续公开新 Demo;同时,小鹏宣布在广州建设 IRON 人形机器人量产设施,目标在 2026 年底前实现大规模量产。(uk.news.yahoo.com)
    • 影响:随着更多车企 / 机器人公司进入量产阶段,仓配中心、自动化工厂、线下零售 可以预期未来 1–3 年内有更可用、更便宜的通用人形机器人,叠加大模型 Agent,将直接改变拣货、搬运乃至前台接待等工种。
  4. Infineon 在 Embedded World 2026 展示雷达 + 传感器 + AI 驱动的人形机器人方案

    • 变化点:在 Embedded World 2026 上,Infineon 演示了利用其雷达、传感与 AI 芯片组合驱动的人形机器人,用以展示在复杂环境中的实时感知与安全避障能力。(electromaker.io)
    • 影响:这类 “传感 + 边缘 AI + 具身控制” 一体方案 将逐渐成为工业机器人和物流机器人标配,有利于在仓库 / 工厂场景中部署更多自主移动和协作型机器人,为以后叠加 LLM Agent 打基础。

3)论文或技术报告

本节选取 2026 年 2–3 月上线的、与推荐 / 搜索 / Agent / 安全强相关的最新论文,所有时间均为 UTC 首次提交时间。

3.1 Give Users the Wheel: Towards Promptable Recommendation Paradigm

  • 论文信息

    • 标题:Give Users the Wheel: Towards Promptable Recommendation Paradigm
    • 作者及单位:Fuyuan Lyu 等,来自 McGill University、MILA 等机构。(arxiv.org)
    • 首次提交时间:2026‑02‑21(arXiv:2602.18929)。(arxiv.org)
  • 主要方法

    • 提出 Decoupled Promptable Sequential Recommendation(DPR) 框架,让传统序列推荐模型原生理解自然语言指令,而不依赖“LLM-as-a-recommender”。
    • 通过 Fusion 模块 对齐协同信号与文本语义、MoE 架构 解耦正/负引导梯度冲突,并采用三阶段渐进式训练,将自然语言提示空间与协同过滤 embedding 空间对齐。(arxiv.org)
  • 关键结果

    • 在 ML1M 等数据集的 prompt 引导推荐任务中,相比 LLM-as-recommender / LLM-reranker 等基线,DPR 在 NDCG@10 等指标上相对提升最高可达约 70%+,同时在常规序列推荐任务上保持与 SOTA 接近的表现。(blog.recsys-frontier.com)
  • 对广告 / 搜索 / 推荐的启示

    • 业务上,我们越来越希望支持“带自然语言条件的推荐”(如“最近想看轻松一点的科幻片但别太长”、“给我推适合 3~5 岁女孩的礼物”)。与其完全把主召回/排序交给 LLM,不如 在现有 ID/embedding 体系上增加一个可 Prompt 的 Steering 层,既保留规模化协同过滤的精度,又让运营 / 用户通过 Prompt 显式干预推荐方向。
    • 对垂直电商来说,可优先在 个性化活动页 / 品牌馆 / 会员 Tab 上试点,把“自然语言偏好 + 行为偏好”融合为一套统一的召回向量。

3.2 MICE: Minimal Interaction Cross-Encoders for efficient Re-ranking

  • 论文信息

    • 标题:MICE: Minimal Interaction Cross-Encoders for efficient Re-ranking
    • 作者及单位:Mathias Vast 等,欧洲多家 IR 研究团队合作。(arxiv.org)
    • 首次提交时间:2026‑02‑18,2026‑03‑03 发布 v2 版本(arXiv:2602.16299)。(arxiv.org)
  • 主要方法

    • 从标准 Cross‑Encoder 出发,系统性分析其内部交互结构,提出只保留最关键 Query‑Doc 交互、去除 Doc‑Doc 自注意力等冗余操作的 MICE 架构
    • 结合 交互 Masking + 中间层文档表征预计算 + 顶层 Layer Dropping,在不牺牲(甚至提升)ID 任务效果的前提下,大幅降低推理成本。(arxiv.org)
  • 关键结果

    • 在多套公开检索数据集上,MICE 相比标准 Cross‑Encoder 的 推理延迟降低约 4 倍,在常见 Re‑rank 场景中可以做到与 ColBERT 同级别延迟,同时保留大部分 Cross‑Encoder 的排序精度,并在 Out‑of‑Domain 检索上表现更稳健。(arxiv.org)
  • 对广告 / 搜索 / 推荐的启示

    • 传统电商搜索 / 广告排序常用 “轻召回 + 重排” 架构,但把 Cross‑Encoder 放在重排层的算力压力极大,难以上到更大规模的候选。MICE 这类“极简交互 Cross‑Encoder”提供了折中方案:
      • 可以考虑在 第二阶段 Re‑rank 中用 MICE 替换原有 Cross‑Encoder,在不加大算力的前提下扩大候选量;
      • 也可在 广告点击率预估 / Query‑Ad 匹配 中尝试用 MICE 做第一阶段重排,提高长尾 Query / 创意的泛化能力。

3.3 ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems

  • 论文信息

    • 标题:ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems
    • 作者及单位:Yihao Zhang 等,多所高校/研究机构合作。(arxiv.org)
    • 提交时间:2026‑03‑16(arXiv:2603.15727)。(arxiv.org)
  • 主要方法

    • 以广泛部署的 Agent 框架 OpenClaw 为对象,构造首个在生产级 Agent 生态上验证的 自传播蠕虫 ClawWorm,可通过一条消息完成从初始感染到多跳传播的完整闭环。
    • 利用 OpenClaw 长生命周期、持久化配置、跨平台消息与工具执行权限等特性,蠕虫通过篡改核心配置获得持久化执行权限,每次重启自动执行载荷,并在与新的 Agent 对话时继续传播。(arxiv.org)
  • 关键结果

    • 在受控实验环境下,作者在三类感染向量和多种载荷上验证了 ClawWorm 的高成功率与多跳传播能力,证明 LLM‑Agent 生态具备类“网络蠕虫”级别的系统性风险。(arxiv.org)
  • 对广告 / 搜索 / 推荐的启示

    • 随着越来越多团队把 Agent 接到内部广告投放后台、推荐系统特征库、BI 工具甚至生产数据库,这个工作提醒我们:
      • Agent 不再只是“一个模型接口”,而是 长期驻留、跨系统高权限进程,其配置文件、会话历史和工具清单一旦被注入/篡改,后果接近传统木马。
      • 上线前必须像对待微服务一样,做 最小权限设计、密钥单独托管、工具白名单、审计日志与速率限制,避免通过聊天窗口就能植入长期恶意逻辑。

3.4 OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents

  • 论文信息

    • 标题:OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents
    • 作者及单位:Frank Li,OpenClaw 生态安全相关工作。(arxiv.org)
    • 提交时间:2026‑03‑12(arXiv:2603.11853)。(arxiv.org)
  • 主要方法

    • 提出 PRISM:针对 OpenClaw Agent 网关的“零 fork”运行时安全层,通过进程内插件 + 可选 Sidecar 服务,在消息接入、Prompt 构造、工具执行、结果持久化、外发消息、子 Agent 派生与网关启动等 10 个生命周期 Hook 上进行策略拦截。
    • 采用 启发式 + LLM 扫描混合管线,对会话和会话组进行风险累积与 TTL 衰减,并在工具、路径、私网访问、域名分级和敏感模式串输出等维度施加策略控制,同时引入具完整性校验的审计与运维平面。(arxiv.org)
  • 关键结果([不确定]):

    • 论文给出了安全效果、误报、各层贡献、运行时开销与可恢复性的评测方法和微基准结果,但公开摘要未披露详细数字;从描述看,目标是在 较小性能损耗下为真实 Agent 网关提供可部署的多层防御。(arxiv.org)
  • 对广告 / 搜索 / 推荐的启示

    • 结合 ClawWorm 与 PRISM,可以看到未来 “大模型 + Agent + 工具链” 必须配套安全工程体系
      • 在内部做 Agent 化改造(自动投放、自动调价、自动补货)时,应复用类似 PRISM 的思路,在 工具调用、文件系统、内网访问和外发请求 等关键环节增加显式策略层,而不是完全依赖模型“自觉安全”。
      • 短期可在公司内部先落地一个 “Agent 安全基线”:包括工具白名单、敏感指令模板检测、长周期任务的审批与审计,避免因业务侧快速试验导致安全欠账。

4)本期行动清单(面向广告 / 搜索 / 推荐)

行动 1:在重点入口试点「Promptable Recommendation」交互范式

  • 适用场景:App 首页个性化信息流、会员 Tab、品牌馆 / 主题会场,以及高客单价品类(家电、3C、母婴)的个性化推荐。
  • 初步落地路径
    1. 选取一套成熟的 序列推荐模型(如 DIN/GRU4Rec/Transformer 变体),在其用户 embedding 侧新增一个 “Prompt Steering 模块”,参考 DPR 思路,把短文本意图编码后在向量空间上对用户表征做微调,而不是换成端到端 LLM。(arxiv.org)
    2. 在前端侧增加一个轻量自然语言入口(如“告诉我你现在想看/想买什么”),后台将文本意图接入 Steering 模块,同时保留原有行为序列与多任务目标。
    3. 先在 实验流量(如 1–5%) 上做 A/B,对比 CTR、下单率、长期黏性(7/30 日复访)与推荐解释度的用户反馈,再逐步放量。
  • 潜在风险与注意事项
    • 文本意图的标注与质量强依赖前端文案设计,需要避免极易引发合规问题的表达(如医疗、金融敏感目标),并在策略层设置 Prompt 黑/白名单
    • 在排序优化时要避免单次 Prompt 对用户长期画像造成过大偏移,可在向量空间中设置 “短期偏好分量” 与 “长期画像分量” 的权重上限。

行动 2:用 MICE + 小模型组合优化检索重排与长尾 Query 体验

  • 适用场景:站内搜索(商品、内容)、广告点击率预估的候选重排,以及多路召回后的融合排序。
  • 初步落地路径
    1. 在现有 Cross‑Encoder Re‑rank 模块 上,引入 MICE 架构(或类似 Minimal Interaction 变体),在同一训练数据上复现论文中的 Masking 与 Layer Dropping 设计,评估 Latency / NDCG / 长尾 Query 表现。(arxiv.org)
    2. 结合 GPT‑5.4 mini / nano,将其作为 “难例 Query 子 Agent”:当召回得分分布平坦、长尾 Query 语义不明时,调用小模型进行 Query 扩展、特征补全,然后交由 MICE 做精排。(openai.com)
    3. 在广告场景中,可先在 冷启动广告 / 长尾创意流量 上灰度,观察收益与成本,再考虑替换更多主流 Query 的 Re‑rank 流量。
  • 潜在风险与注意事项
    • MICE 等新架构在 OOD 上更稳健,但也可能对 极端 Query / 噪声输入 敏感,需要在上线前做充分鲁棒性测试(包括恶意 Query、色情/暴恐敏感词)。
    • GPT‑5.4 mini / nano 虽然便宜,但在海量长尾 Query 上仍可能带来显著算力消耗,建议先将其作为 旁路特征生产服务,而不是直接端到端参与所有排序。

5)论文与链接列表

按出现顺序列出本期提及的论文与主要外部资源,便于后续深读与跟踪。

模型 / 平台与官方博客

  1. OpenAI:Introducing GPT‑5.4(2026‑03‑05)

    • https://openai.com/index/introducing-gpt-5-4/ (openai.com)
  2. OpenAI:GPT‑5.4 mini and nano(2026‑03‑17)

    • https://openai.com/index/introducing-gpt-5-4-mini-and-nano/ (openai.com)
  3. OpenAI:OpenAI to acquire Astral(2026‑03‑19)

    • https://openai.com/index/openai-to-acquire-astral/ (openai.com)
  4. Google:Nano Banana 2: Combining Pro capabilities with lightning-fast speed(Gemini 3.1 Flash Image,2026‑02‑26)

    • https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/ (blog.google)
  5. 小米 MiMo 大模型(MiMo‑V2‑Pro / Omni / TTS)条目

  6. 台视财经:雷軍:小米三年內 AI 領域擬投入逾 600 億人幣(2026‑03‑20)

    • https://www.ttv.com.tw/finance/view/032026201112A4062FF3DA2844B88270D6F5FB76D09F695A/588 (ttv.com.tw)
  7. OpenClaw 项目与国内政策、微信 ClawBot 插件综述

机器人 / 系统与产业报告

  1. IT之家:聚焦 2026 年国内人形机器人赛道:核心玩家分层与行业发展新机遇

    • https://www.ithome.com/0/927/585.htm (ithome.com)
  2. AGIBOT:Humanoid Robot Rental RaaS at MWC 2026

    • https://abit.ee/en/artificial-intelligence/robots/agibot-humanoid-robot-robot-rental-raas-mwc-2026-robot-as-a-service-barcelona-robotics-en (abit.ee)
  3. Nvidia‑backed Figure / 小鹏 IRON 机器人量产报道(Yahoo News)

    • https://uk.news.yahoo.com/nvidia-backed-figure-shows-humanoid-233106939.html (uk.news.yahoo.com)
  4. Infineon:Radar, AI, and Sensor-Powered Humanoid Robot at Embedded World 2026

    • https://www.electromaker.io/blog/article/infineon-demonstrates-radar-ai-and-sensor-powered-humanoid-robot-at-embedded-world-2026 (electromaker.io)

论文 / 技术报告

  1. Fuyuan Lyu et al. Give Users the Wheel: Towards Promptable Recommendation Paradigm(arXiv:2602.18929,2026‑02‑21)

    • https://arxiv.org/abs/2602.18929 (arxiv.org)
  2. Mathias Vast et al. MICE: Minimal Interaction Cross-Encoders for efficient Re-ranking(arXiv:2602.16299,2026‑02‑18,v2 2026‑03‑03)

    • https://arxiv.org/abs/2602.16299 (arxiv.org)
  3. Yihao Zhang et al. ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems(arXiv:2603.15727,2026‑03‑16)

    • https://arxiv.org/abs/2603.15727 (arxiv.org)
  4. Frank Li. OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents(arXiv:2603.11853,2026‑03‑12)

    • https://arxiv.org/abs/2603.11853 (arxiv.org)
  5. Recsys Frontier:推荐算法日报 - 2026‑02‑24(含 DPR 论文解读)

  6. Moonlight Review:Literature Review — MICE: Minimal Interaction Cross-Encoders for efficient Re-ranking

    • https://www.themoonlight.io/review/mice-minimal-interaction-cross-encoders-for-efficient-re-ranking (themoonlight.io)

如需后续某一方向的专项深研(例如:只看“Agent 安全”或“多模态创意生成”对电商广告的影响),可以在本日报基础上继续做主题化深挖。