《AI 深研 · AI月报》
时间范围:2026-01-01 00:00:00 ~ 2026-01-31 23:59:59(北京时间)
1)模型 / 平台
百度文心大模型 5.0 正式版发布(2.4 万亿参数原生全模态)
1 月 22 日,百度在“文心 Moment”大会发布并上线文心大模型 5.0 正式版,采用统一自回归原生全模态架构,参数规模 2.4 万亿,支持文本 / 图像 / 音频 / 视频统一理解与生成,已接入文心 APP、文心一言官网和千帆平台,官方宣称在 40+ 基准上语言与多模态能力超越 Gemini‑2.5‑Pro、GPT‑5‑High 等模型。(finance.sina.com.cn)
影响:为电商图文视频理解、商品讲解视频生成、多模态广告创意提供国产高性能底座,且可通过千帆平台较方便地做企业级私有化和行业精调。美团上线“问小团” AI 搜索,基于自研 LongCat + 多模型融合
1 月 22 日,美团 App 升级至 12.51.202 版本,上线“问小团” AI 搜索功能:在搜索框输入自然语言长句即可获得综合商户地址、营业时间、门店设施、用户评价等多源数据的本地生活决策建议;其底层采用美团自研 LongCat 模型,并按需求动态融合多种主流大模型。(finance.sina.com.cn)
影响:从“关键词检索 + 单次排序”跃迁为“场景问答 + 在线特征计算 + 多模型协同”,本质是一个面向本地生活的 Agent 式搜索入口,对所有做本地 / 生活服务搜索和广告承接的业务具有强对标意义。OpenAI 在 ChatGPT Free / Go 测试广告,迈向对话式广告平台
1 月中旬起,多家媒体确认 OpenAI 将在美国地区对 ChatGPT 免费版和低价 ChatGPT Go(约 8 美元/月)用户展示上下位置的“Sponsored”广告,Plus / Pro / Business / Enterprise 保持无广告;广告仅对成人展示,不出现在健康、心理健康、政治等敏感话题对话中。(theguardian.com)
影响:ChatGPT 首次大规模引入上下文相关广告,为“大模型 × 搜索 / 推荐广告”定价与产品形态提供真实样本,但关于实际 eCPM 水平(有报道提到 CPM ~60 美元)、定向粒度和归因能力目前主要来自二手消息 [不确定],建议持续跟踪 OpenAI 产品页与开发者文档以校准判断。OpenAI 宣布在 ChatGPT 侧退休 GPT‑4o / 4.1 系列
1 月 29 日,OpenAI 发布公告:自 2026-02-13 起,在 ChatGPT 前端退休 GPT‑4o、GPT‑4.1、GPT‑4.1 mini 和 o4‑mini 模型,API 暂不调整。(openai.com)
影响:说明前端体验将快速向 GPT‑5.1 / 5.2 等新系列集中,依赖旧模型风格或行为(如 GPT‑4o 的“更暖”对话风格)设计的广告创意工作流需要在 2 月前完成迁移和多模型 AB 校验。OpenAI 与 Cerebras / SB Energy 深度绑定 AI 基础设施
1 月 9 日,OpenAI 与 SoftBank 旗下 SB Energy 宣布设立 10 亿美元投资与 1.2 GW 数据中心租赁协议,用于“Stargate” 超大算力园区建设;(openai.com) 1 月 14 日又宣布与 Cerebras 合作,引入 750MW、主打长输出和低时延推理的专用推理算力。(openai.com)
影响:这些基础设施项目将直接支撑更高并发的多轮 Agent、长文档总结、批量创意生成等场景,利好将复杂投放策略 / 搜索运营链路交给 Agent 自动执行的中长期规划。Anthropic 发布 Claude Cowork:从“聊天机器人”走向桌面 Agent
1 月 13 日左右,Anthropic 推出 Claude Cowork:在 macOS Claude Desktop 内的高自治 Agent,可访问用户授权的本地文件夹,自动读写文档、整理下载目录、基于截图生成表格等;1 月 23 日进一步扩展到 Team / Enterprise 付费计划。(time.com)
影响:Cowork 将“会写代码的 Claude Code”能力迁移到通用办公,给“广告运营 / 品牌 / 搜索团队内部知识库 + 本地文档”的自动化 agent 提供了现成 UX 和权限模型样板。Anthropic 推出 Claude for Healthcare 行业云
1 月上旬,Anthropic 在 JPM26 大会上发布 Claude for Healthcare,提供 HIPAA 就绪的医疗版 Claude,支持对接 CMS、ICD‑10、PubMed 等数据,自动化理赔、预授权和临床文档等流程。(lawrenceevans.com)
影响:体现顶级厂商正走“通用模型 + 高度垂直化 SaaS 封装”路线,这对电商平台自建“广告法合规审核大模型”“商家风控大模型”等行业专用模型具有直接启发。Google Gemini Personal Intelligence:深度绑定第一方数据的 AI 助手
1 月 14 日起,Google 为 Gemini Pro / Ultra 用户开放“Personal Intelligence”测试版,可在用户授权下访问 Gmail、Photos、YouTube、Search 历史等,回答高度个性化问题;功能默认关闭,仅面向美国付费用户。(digitalstrategy-ai.com)
影响:这是“LLM × 第一方行为数据”的标志性落地,对任何掌握丰富行为日志的一方(电商、内容平台)如何在隐私合规前提下做“深度个性化推荐 / 搜索结果重排”提供了强参考,同时也放大了数据误用与“数据串味”的风险。Meta 发布《2026: AI Drives Performance》:用数据证明 AI 排序价值
1 月 28 日,Meta 回顾 2025Q4:通过 AI 优化 Facebook Feed 与视频排序,使美国视频观看时长实现两位数同比增长;Facebook 同日 Reels 推荐量提升 25% 以上,Instagram 上 75% 的推荐内容来自原创。(about.fb.com)
影响:为“用大模型 / 强化学习做推荐排序”提供了直接业务侧收益数据,对短视频电商、内容电商中加大“AI 排序 + 内容理解”投入给了比较坚实的商业论据。Runway Gen‑4.5 与世界模型 GWM‑1 在 NVIDIA Rubin 上首发
1 月 5 日,Runway 宣布其视频生成模型 Gen‑4.5 和首个通用世界模型家族 GWM‑1 已迁移到 NVIDIA 新一代 Rubin 平台(Vera Rubin NVL72),强调长序列视频和世界模型推理的效率提升。(runwayml.com) 同期用户感知实验表明,人类仅以 57.1% 准确率区分 Gen‑4.5 生成视频与真实视频。(techradar.com)
影响:在短视频广告、直播预热视频生成上,AI 视频已基本逼近“肉眼难辨”的临界点,平台侧必须尽快完善溯源 / 水印和内容审查策略。**Yuan3.0 Flash:面向企业的开源