AIX Pilot - Pilot Your Work with AI

《AI 深研 · AI月报》

时间范围：2026-01-01 00:00:00 ~ 2026-01-31 23:59:59（北京时间）

1）模型 / 平台

百度文心大模型 5.0 正式版发布（2.4 万亿参数原生全模态）
1 月 22 日，百度在“文心 Moment”大会发布并上线文心大模型 5.0 正式版，采用统一自回归原生全模态架构，参数规模 2.4 万亿，支持文本 / 图像 / 音频 / 视频统一理解与生成，已接入文心 APP、文心一言官网和千帆平台，官方宣称在 40+ 基准上语言与多模态能力超越 Gemini‑2.5‑Pro、GPT‑5‑High 等模型。(finance.sina.com.cn)
影响：为电商图文视频理解、商品讲解视频生成、多模态广告创意提供国产高性能底座，且可通过千帆平台较方便地做企业级私有化和行业精调。
美团上线“问小团” AI 搜索，基于自研 LongCat + 多模型融合
1 月 22 日，美团 App 升级至 12.51.202 版本，上线“问小团” AI 搜索功能：在搜索框输入自然语言长句即可获得综合商户地址、营业时间、门店设施、用户评价等多源数据的本地生活决策建议；其底层采用美团自研 LongCat 模型，并按需求动态融合多种主流大模型。(finance.sina.com.cn)
影响：从“关键词检索 + 单次排序”跃迁为“场景问答 + 在线特征计算 + 多模型协同”，本质是一个面向本地生活的 Agent 式搜索入口，对所有做本地 / 生活服务搜索和广告承接的业务具有强对标意义。
OpenAI 在 ChatGPT Free / Go 测试广告，迈向对话式广告平台
1 月中旬起，多家媒体确认 OpenAI 将在美国地区对 ChatGPT 免费版和低价 ChatGPT Go（约 8 美元/月）用户展示上下位置的“Sponsored”广告，Plus / Pro / Business / Enterprise 保持无广告；广告仅对成人展示，不出现在健康、心理健康、政治等敏感话题对话中。(theguardian.com)
影响：ChatGPT 首次大规模引入上下文相关广告，为“大模型 × 搜索 / 推荐广告”定价与产品形态提供真实样本，但关于实际 eCPM 水平（有报道提到 CPM ~60 美元）、定向粒度和归因能力目前主要来自二手消息 [不确定]，建议持续跟踪 OpenAI 产品页与开发者文档以校准判断。
OpenAI 宣布在 ChatGPT 侧退休 GPT‑4o / 4.1 系列
1 月 29 日，OpenAI 发布公告：自 2026-02-13 起，在 ChatGPT 前端退休 GPT‑4o、GPT‑4.1、GPT‑4.1 mini 和 o4‑mini 模型，API 暂不调整。(openai.com)
影响：说明前端体验将快速向 GPT‑5.1 / 5.2 等新系列集中，依赖旧模型风格或行为（如 GPT‑4o 的“更暖”对话风格）设计的广告创意工作流需要在 2 月前完成迁移和多模型 AB 校验。
OpenAI 与 Cerebras / SB Energy 深度绑定 AI 基础设施
1 月 9 日，OpenAI 与 SoftBank 旗下 SB Energy 宣布设立 10 亿美元投资与 1.2 GW 数据中心租赁协议，用于“Stargate” 超大算力园区建设；(openai.com) 1 月 14 日又宣布与 Cerebras 合作，引入 750MW、主打长输出和低时延推理的专用推理算力。(openai.com)
影响：这些基础设施项目将直接支撑更高并发的多轮 Agent、长文档总结、批量创意生成等场景，利好将复杂投放策略 / 搜索运营链路交给 Agent 自动执行的中长期规划。
Anthropic 发布 Claude Cowork：从“聊天机器人”走向桌面 Agent
1 月 13 日左右，Anthropic 推出 Claude Cowork：在 macOS Claude Desktop 内的高自治 Agent，可访问用户授权的本地文件夹，自动读写文档、整理下载目录、基于截图生成表格等；1 月 23 日进一步扩展到 Team / Enterprise 付费计划。(time.com)
影响：Cowork 将“会写代码的 Claude Code”能力迁移到通用办公，给“广告运营 / 品牌 / 搜索团队内部知识库 + 本地文档”的自动化 agent 提供了现成 UX 和权限模型样板。
Anthropic 推出 Claude for Healthcare 行业云
1 月上旬，Anthropic 在 JPM26 大会上发布 Claude for Healthcare，提供 HIPAA 就绪的医疗版 Claude，支持对接 CMS、ICD‑10、PubMed 等数据，自动化理赔、预授权和临床文档等流程。(lawrenceevans.com)
影响：体现顶级厂商正走“通用模型 + 高度垂直化 SaaS 封装”路线，这对电商平台自建“广告法合规审核大模型”“商家风控大模型”等行业专用模型具有直接启发。
Google Gemini Personal Intelligence：深度绑定第一方数据的 AI 助手
1 月 14 日起，Google 为 Gemini Pro / Ultra 用户开放“Personal Intelligence”测试版，可在用户授权下访问 Gmail、Photos、YouTube、Search 历史等，回答高度个性化问题；功能默认关闭，仅面向美国付费用户。(digitalstrategy-ai.com)
影响：这是“LLM × 第一方行为数据”的标志性落地，对任何掌握丰富行为日志的一方（电商、内容平台）如何在隐私合规前提下做“深度个性化推荐 / 搜索结果重排”提供了强参考，同时也放大了数据误用与“数据串味”的风险。
Meta 发布《2026: AI Drives Performance》：用数据证明 AI 排序价值
1 月 28 日，Meta 回顾 2025Q4：通过 AI 优化 Facebook Feed 与视频排序，使美国视频观看时长实现两位数同比增长；Facebook 同日 Reels 推荐量提升 25% 以上，Instagram 上 75% 的推荐内容来自原创。(about.fb.com)
影响：为“用大模型 / 强化学习做推荐排序”提供了直接业务侧收益数据，对短视频电商、内容电商中加大“AI 排序 + 内容理解”投入给了比较坚实的商业论据。
Runway Gen‑4.5 与世界模型 GWM‑1 在 NVIDIA Rubin 上首发
1 月 5 日，Runway 宣布其视频生成模型 Gen‑4.5 和首个通用世界模型家族 GWM‑1 已迁移到 NVIDIA 新一代 Rubin 平台（Vera Rubin NVL72），强调长序列视频和世界模型推理的效率提升。(runwayml.com) 同期用户感知实验表明，人类仅以 57.1% 准确率区分 Gen‑4.5 生成视频与真实视频。(techradar.com)
影响：在短视频广告、直播预热视频生成上，AI 视频已基本逼近“肉眼难辨”的临界点，平台侧必须尽快完善溯源 / 水印和内容审查策略。
**Yuan3.0 Flash：面向企业的开源

AI月报 - 2026年01月

1）模型 / 平台