LIVE

← 2026-05-16 · 周六 →

每日AI日报

锦成的 AI 信号场 · 今日 12 条关键信号，覆盖模型、商业化、政策、机器人

今日信号

新模型

$70B+

融资动向

政策动向

▎ 编辑视角

今天最值得看的不是新模型本身，而是 商业基本盘的换挡：OpenAI 250 亿、Anthropic 190 亿年化收入逼近，OpenAI 解除微软独家授权，IPO 路径开始铺设。模型能力的差异化窗口在收窄，分发、企业落地、安全合规正在成为下一阶段的胜负手。国内这边，文心 5.1 用 6% 的预训练成本上 LMArena 全球第四，是「工程效率压住堆算力」的一个标志性回合。

模型发布 4 条

百百度 · 5月9日 · 量子位

文心 5.1 发布：搜索榜国内第一、全球第四，预训练成本仅业界 6%

百度正式发布新一代基础大模型 文心 5.1，采用「多维弹性预训练」技术，仅以业界同规模模型约 6% 的预训练成本达到基础效果领先水平。在 LMArena 搜索榜以 1223 分登顶国内、位列全球第四，是当前唯一上榜的国产模型。

LMArena 搜索榜1223 分国内排名第 1 全球排名第 4 训练成本行业 6%

# 大模型 # 国产 # 热点

A Anthropic · 5月初 · State of AI · Air Street

Claude Mythos Preview + Project Glasswing：把前沿模型先送给安全圈

Anthropic 推出 Claude Mythos Preview，主打识别软件代码中的弱点与安全漏洞。模型并未公开放量，而是通过新设的 Project Glasswing 网络安全计划限量交付给一批合作企业。最新红队评测中，Mythos Preview 是首个在一个月内单跑通 32 步端到端网络攻击链路的前沿模型，OpenAI GPT-5.5 三周后跟上。

# 大模型 # 网络安全 # 治理

O OpenAI · 5月6日 · OpenAI News

GPT-5.5 Instant 上线 ChatGPT，作为新的默认模型

北京时间 5 月 6 日，OpenAI 正式发布 GPT-5.5 Instant 并切换为 ChatGPT 默认模型；旗舰推理版 GPT-5.5 Pro 此前在 4 月放出，定位「目前大模型能达到的最高智能水平」。Instant 版本的目标更直接：把推理质量沉到大规模日活场景里能扛住的成本曲线下。

# 大模型 # ChatGPT

G Google DeepMind × Waymo · 5月 · State of AI

Waymo World Model：用 Genie 3 给自动驾驶造极端场景

Waymo 推出 Waymo World Model，底座是 DeepMind 的 Genie 3，专门用来生成极端、罕见的驾驶场景，并同步输出对齐的 2D 视频与 3D 激光雷达数据。这件事的真正信号不是又一个 world model，而是 仿真数据闭环正式成为自动驾驶迭代的主输入。

# World Model # 自动驾驶 # 数据合成

商业 & 融资 4 条

O OpenAI · 5月 · Crescendo AI

OpenAI 年化收入突破 $25B，传出 IPO 早期信号

OpenAI 已经把年化收入推过 250 亿美元，并据报道已经开始为公开上市做早期准备。同期 Anthropic 年化逼近 190 亿。模型层的故事正在让位给收入故事——谁能把企业付费率扛上去，谁就能继续撑住下一轮估值。

OpenAI ARR$25B+ Anthropic ARR~$19B

# 公司 # IPO # 热点

O OpenAI × Microsoft · 5月 · 知乎专栏

OpenAI 解除微软独家授权，许可期延至 2032

OpenAI 宣布其模型与产品 IP 的许可不再独家授权给微软，授权窗口延续到 2032 年，但已对其他云厂商开放。这是 OpenAI 从「Azure 唯一发行通道」走向「跨云分发」的关键一步，对 AWS / Oracle / GCP 之间的算力订单分配会有直接影响。

# 公司动态 # 云厂商

D DeepSeek · 本周 · 证券时报

DeepSeek 启动首轮融资，估值 450 亿美元、大基金领投

DeepSeek 启动成立以来首轮对外融资，估值 450 亿美元，由「国家集成电路产业投资基金」领投。一个长期对外保持自筹姿态的团队第一次接外部资金，背后的信号是：算力账单已经压到不接钱就跑不动的临界点。

# 融资 # 国产

月月之暗面 Moonshot · 本月 · 证券时报

月之暗面新一轮 $20 亿融资进入交割

Kimi 母公司月之暗面正推进新一轮 20 亿美元 融资，目前已进入交割阶段。叠加 DeepSeek 那边的 450 亿估值轮，国产大模型独角兽的「再充电」节奏在 5 月集中触发。

# 融资 # 国产

智能体 & 机器人 2 条

O OpenAI · 5月 · State of AI

OpenAI 发布 Frontier：面向企业的 Agent 构建与编排平台

OpenAI 推出 Frontier，定位是企业级 AI Agent 的构建、部署与运营平台，主打共享上下文与现有系统集成，目的是把碎掉的工作流拼回一个连贯的语义层。配套披露：OpenAI Deployment Company 计划已筹集约 40 亿美元，正在评估收购工程服务/咨询类公司——意图把 Agent 落地这件事产品化、卖服务化。

# Agent # 企业 # 平台

BD Boston Dynamics × Google · 5月 · State of AI

Spot 机器狗装上 Gemini Robotics-ER 1.6

Boston Dynamics 与 Google Cloud、DeepMind 合作，把 Gemini Robotics-ER 1.6 集成进 Spot 机器狗与 Orbit AI 视觉巡检平台。这件事的关键不是机器狗，而是「具身推理模型 + 工业巡检场景」走到了能签合同的阶段——下一步是工厂巡检、园区安防、电网巡线的真实订单。

# 具身智能 # 机器人 # 工业

政策 & 治理 2 条

网国家网信办等三部门 · 本月 · 陕西日报

三部门印发《智能体规范应用与创新发展实施意见》

网信办、发改委、工信部联合印发《智能体规范应用与创新发展实施意见》，明确「安全可控、规范有序、创新驱动、应用牵引」四条基本原则。这是国内第一份把「Agent」单独拎出来管的官方文件——之前管的是模型、是生成内容，这次开始管「能自己干活的 AI」。

# 政策 # Agent # 热点

US CAISI（美国 AI 标准与创新中心） · 5月5日 · CNBC

特朗普政府扩大 AI 监管：Google、微软、xAI 模型须先评测

美国 CAISI 与 Google DeepMind、Microsoft、xAI 达成协议，三家公司的前沿模型在公开发布前必须先交给 CAISI 评测。这是在 2024 年与 OpenAI、Anthropic 合作框架基础上的扩面——「前沿模型预评测」正式从自愿走向行业默认动作。

# 政策 # 美国 # 监管

▎ 今日一句话

模型层在压成本，应用层在抢分发，政策层在管 Agent。三层节奏第一次同步加速——下一个季度，看哪个国产团队第一个把「企业 Agent」做成有 SLA 的标准产品。