LIVE
2026-05-16 · 周六

每日AI日报

锦成的 AI 信号场 · 今日 12 条关键信号,覆盖模型、商业化、政策、机器人
12
今日信号
4
新模型
$70B+
融资动向
2
政策动向
▎ 编辑视角
今天最值得看的不是新模型本身,而是 商业基本盘的换挡:OpenAI 250 亿、Anthropic 190 亿年化收入逼近,OpenAI 解除微软独家授权,IPO 路径开始铺设。模型能力的差异化窗口在收窄,分发、企业落地、安全合规正在成为下一阶段的胜负手。国内这边,文心 5.1 用 6% 的预训练成本上 LMArena 全球第四,是「工程效率压住堆算力」的一个标志性回合。
模型发布 4 条
百度 · 5月9日 · 量子位

文心 5.1 发布:搜索榜国内第一、全球第四,预训练成本仅业界 6%

百度正式发布新一代基础大模型 文心 5.1,采用「多维弹性预训练」技术,仅以业界同规模模型约 6% 的预训练成本达到基础效果领先水平。在 LMArena 搜索榜以 1223 分登顶国内、位列全球第四,是当前唯一上榜的国产模型。
LMArena 搜索榜1223 分 国内排名第 1 全球排名第 4 训练成本行业 6%
# 大模型 # 国产 # 热点
A Anthropic · 5月初 · State of AI · Air Street

Claude Mythos Preview + Project Glasswing:把前沿模型先送给安全圈

Anthropic 推出 Claude Mythos Preview,主打识别软件代码中的弱点与安全漏洞。模型并未公开放量,而是通过新设的 Project Glasswing 网络安全计划限量交付给一批合作企业。最新红队评测中,Mythos Preview 是首个在一个月内单跑通 32 步端到端网络攻击链路的前沿模型,OpenAI GPT-5.5 三周后跟上。
# 大模型 # 网络安全 # 治理
O OpenAI · 5月6日 · OpenAI News

GPT-5.5 Instant 上线 ChatGPT,作为新的默认模型

北京时间 5 月 6 日,OpenAI 正式发布 GPT-5.5 Instant 并切换为 ChatGPT 默认模型;旗舰推理版 GPT-5.5 Pro 此前在 4 月放出,定位「目前大模型能达到的最高智能水平」。Instant 版本的目标更直接:把推理质量沉到大规模日活场景里能扛住的成本曲线下
# 大模型 # ChatGPT
G Google DeepMind × Waymo · 5月 · State of AI

Waymo World Model:用 Genie 3 给自动驾驶造极端场景

Waymo 推出 Waymo World Model,底座是 DeepMind 的 Genie 3,专门用来生成极端、罕见的驾驶场景,并同步输出对齐的 2D 视频与 3D 激光雷达数据。这件事的真正信号不是又一个 world model,而是 仿真数据闭环正式成为自动驾驶迭代的主输入
# World Model # 自动驾驶 # 数据合成
商业 & 融资 4 条
O OpenAI · 5月 · Crescendo AI

OpenAI 年化收入突破 $25B,传出 IPO 早期信号

OpenAI 已经把年化收入推过 250 亿美元,并据报道已经开始为公开上市做早期准备。同期 Anthropic 年化逼近 190 亿。模型层的故事正在让位给收入故事——谁能把企业付费率扛上去,谁就能继续撑住下一轮估值
OpenAI ARR$25B+ Anthropic ARR~$19B
# 公司 # IPO # 热点
O OpenAI × Microsoft · 5月 · 知乎专栏

OpenAI 解除微软独家授权,许可期延至 2032

OpenAI 宣布其模型与产品 IP 的许可不再独家授权给微软,授权窗口延续到 2032 年,但已对其他云厂商开放。这是 OpenAI 从「Azure 唯一发行通道」走向「跨云分发」的关键一步,对 AWS / Oracle / GCP 之间的算力订单分配会有直接影响。
# 公司动态 # 云厂商
D DeepSeek · 本周 · 证券时报

DeepSeek 启动首轮融资,估值 450 亿美元、大基金领投

DeepSeek 启动成立以来首轮对外融资,估值 450 亿美元,由「国家集成电路产业投资基金」领投。一个长期对外保持自筹姿态的团队第一次接外部资金,背后的信号是:算力账单已经压到不接钱就跑不动的临界点
# 融资 # 国产
月之暗面 Moonshot · 本月 · 证券时报

月之暗面新一轮 $20 亿融资进入交割

Kimi 母公司月之暗面正推进新一轮 20 亿美元 融资,目前已进入交割阶段。叠加 DeepSeek 那边的 450 亿估值轮,国产大模型独角兽的「再充电」节奏在 5 月集中触发。
# 融资 # 国产
智能体 & 机器人 2 条
O OpenAI · 5月 · State of AI

OpenAI 发布 Frontier:面向企业的 Agent 构建与编排平台

OpenAI 推出 Frontier,定位是企业级 AI Agent 的构建、部署与运营平台,主打共享上下文与现有系统集成,目的是把碎掉的工作流拼回一个连贯的语义层。配套披露:OpenAI Deployment Company 计划已筹集约 40 亿美元,正在评估收购工程服务/咨询类公司——意图把 Agent 落地这件事产品化、卖服务化。
# Agent # 企业 # 平台
BD Boston Dynamics × Google · 5月 · State of AI

Spot 机器狗装上 Gemini Robotics-ER 1.6

Boston Dynamics 与 Google Cloud、DeepMind 合作,把 Gemini Robotics-ER 1.6 集成进 Spot 机器狗与 Orbit AI 视觉巡检平台。这件事的关键不是机器狗,而是「具身推理模型 + 工业巡检场景」走到了能签合同的阶段——下一步是工厂巡检、园区安防、电网巡线的真实订单。
# 具身智能 # 机器人 # 工业
政策 & 治理 2 条
国家网信办 等三部门 · 本月 · 陕西日报

三部门印发《智能体规范应用与创新发展实施意见》

网信办、发改委、工信部联合印发《智能体规范应用与创新发展实施意见》,明确「安全可控、规范有序、创新驱动、应用牵引」四条基本原则。这是国内第一份把「Agent」单独拎出来管的官方文件——之前管的是模型、是生成内容,这次开始管「能自己干活的 AI」
# 政策 # Agent # 热点
US CAISI(美国 AI 标准与创新中心) · 5月5日 · CNBC

特朗普政府扩大 AI 监管:Google、微软、xAI 模型须先评测

美国 CAISI 与 Google DeepMind、Microsoft、xAI 达成协议,三家公司的前沿模型在公开发布前必须先交给 CAISI 评测。这是在 2024 年与 OpenAI、Anthropic 合作框架基础上的扩面——「前沿模型预评测」正式从自愿走向行业默认动作。
# 政策 # 美国 # 监管
▎ 今日一句话
模型层在压成本,应用层在抢分发,政策层在管 Agent。三层节奏第一次同步加速——下一个季度,看哪个国产团队第一个把「企业 Agent」做成有 SLA 的标准产品。