2026-05-21 · Markdown

AI 早报 2026-05-21

视频版：哔哩哔哩｜ YouTube

概览

产品应用

Hugging Face 上线 Hardware 页面及模型参数筛选功能 ↗ #1
Google 发布跨平台 Agent Ask Advisor 及多项广告 AI 更新 ↗ #2

模型发布

千问发布新一代旗舰 Qwen3.7-Max，即将上线百炼 API ↗ #3
Cohere 发布开源模型 Command A+ ↗ #4
Stability AI 发布 Stable Audio 3.0 系列音频模型 ↗ #5
NVIDIA 推出 SANA-WM 分钟级视频生成模型 ↗ #6

技术与洞察

Z.ai 等联合部署 ZCube 网络架构：推理吞吐提升 15% ↗ #7

行业动态

DeepSeek 组建 Harness 团队，招聘中 #8
Exa 完成 2.5 亿美元 C 轮融资，估值达 22 亿美元 ↗ #9
OpenAI 推出“OpenAI for Singapore”多年期合作计划 ↗ #10

前瞻与传闻

报道称 OpenAI 计划最快本周提交 IPO 申请 ↗ #11
消息称白宫已向 OpenAI 等企业通报前沿 AI 模型审查计划 ↗ #12

产品应用

Hugging Face 上线 Hardware 页面及模型参数筛选功能 `#1`

Hugging Face 宣布为 Dataset Leaderboard 新增按模型参数量级筛选基准测试结果的功能，并推出用于展示开源 AI 社区真实硬件使用情况的 Hugging Face Hardware。

Hugging Face 官方宣布为 Dataset Leaderboard 新增了按模型参数范围筛选基准测试结果的功能，帮助用户查找特定参数限制下的最优模型。同时，其联合创始人 Julien Chaumond 宣布推出 Hugging Face Hardware，旨在呈现开源 AI 生态系统的真实世界硬件运行情况。该硬件追踪功能将提供热门 GPU 与 CPU 统计、VRAM 分布情况以及推理硬件的发展趋势。

相关链接：

Google 发布跨平台 Agent Ask Advisor 及多项广告 AI 更新 `#2`

Google 连续发布多项广告与营销 AI 更新，宣布跨产品Agent “Ask Advisor” 现已面向英文账户推出测试版，Asset Studio 即将集成 Gemini Omni 模型，并在 AI Mode 中测试多种由 Gemini 驱动的新型广告格式。

Google 宣布了一系列针对其广告与营销平台的 AI 更新，旨在统一用户体验并提升广告互动性。该公司推出了跨产品 Agent Ask Advisor 以连接 Google Ads、Analytics 和 Merchant Center，为 Asset Studio 引入了多模态功能并即将整合 Gemini Omni，同时还在测试由 Gemini 模型驱动的新型搜索广告格式。目前 Ask Advisor 仅限英文账户参与测试，Asset Studio 的新功能将于今年夏季面向全球英语用户推出，而新的搜索广告格式和扩展的 Direct Offers 试点正处于测试或逐步推进阶段。

相关链接：

模型发布

千问发布新一代旗舰 Qwen3.7-Max，即将上线百炼 API `#3`

Qwen 团队正式发布面向 Agent 时代的旗舰模型 Qwen3.7-Max，主打编程、办公自动化与长周期自主执行能力。官方称，该模型在编程 Agent、通用 Agent 及高难度推理等多个评测维度表现领先，即将通过阿里云百炼 API 上线。

阿里千问正式发布新一代旗舰模型 Qwen3.7-Max，定位为面向 Agent 时代的全能基座模型。官方称，该模型在编程 Agent、通用 Agent 及高难度推理等多个评测维度表现领先或居前，在一项 35 小时、1158 次工具调用的自主 kernel 优化实验中实现相对参考实现 10.0 倍的几何平均加速。该模型采用任务-运行框架-验证器正交解耦训练架构，原生适配 Claude Code、OpenClaw、Qwen Code 等主流智能体框架，支持 MCP 集成与多智能体协作，并可通过工具调用操控机器狗等具身设备。API 即将通过阿里云百炼上线。

相关链接：

https://qwenlm.github.io/zh/blog/qwen3.7/

Cohere 发布开源模型 Command A+ `#4`

Cohere发布开源大模型Command A+。该模型采用218B总参数和25B激活参数的MoE架构，它整合了前代视觉与推理能力，专精Agentic任务。

Cohere 发布开源大模型 Command A+，该模型基于 Apache 2.0 许可，采用 218B 总参与 25B 激活参的 Sparse MoE 架构。官方称，该模型统一了前代 Command A 系列能力，支持 128K 上下文、64K 输出、图像输入及 48 种语言，专为 Agentic 任务与高性能企业环境优化。模型提供 BF16、FP8 和 W4A4 三种量化版本，通过引入推测解码和新分词器提升了推理效率。官方推荐的 W4A4 版本最低仅需单块 B200 或两块 H100 GPU 即可运行，目前权重已在 Hugging Face 发布。

相关链接：

Stability AI 发布 Stable Audio 3.0 系列音频模型 `#5`

Stability AI 发布 Stable Audio 3.0 系列音频生成模型，提供多个规格，其中小号与中号版本以开放权重形式发布，支持最长 6 分钟的音频生成，可在一定限制下免费商用。

Stability AI 推出了名为 Stable Audio 3.0 的音频生成模型系列。该系列共包含四个模型，基于新的语义-声学自编码器架构构建，旨在实现可变长度的音频生成与编辑。其中，small SFX、small 与 medium 三个模型的权重已开放，large 模型则仅通过 API 及付费自托管服务提供。官方表示，用户对生成内容的输出拥有所有权，年收入低于 100 万美元的用户可根据社区许可证进行分发与商业化。公司同时开放了面向专业音乐家的产品套件候补名单。

相关链接：

NVIDIA 推出 SANA-WM 分钟级视频生成模型 `#6`

NVIDIA 开源世界模型 SANA-WM，支持基于单张图像与摄像机轨迹，在单块 GPU 上生成 720p 分辨率的 60 秒可控视频。

NVIDIA 研究团队发布了名为 SANA-WM 的开源世界模型，该模型原生支持一分钟时长的视频生成。SANA-WM 包含 26 亿参数，能够接收单张图像、文本提示词以及精确的 6 自由度摄像机轨迹作为输入，进而合成 720p 分辨率的高保真视频。其架构核心采用混合线性注意力机制与双分支摄像机控制设计，并结合了两阶段生成管道。官方称，该模型在单块 H100 GPU 上即可完成一分钟视频的推理，而其经过蒸馏与 NVFP4 量化的变体更可在单块 RTX 5090 上仅需 34 秒完成 60 秒 720p 视频的去噪。目前，该模型的双向检查点、推理代码及相关组件已在 Hugging Face 上正式开源。

相关链接：

技术与洞察

Z.ai 等联合部署 ZCube 网络架构：推理吞吐提升 15% `#7`

智谱与相关机构联合开发并在生产环境部署了 ZCube 网络架构。官方数据显示，该架构使 GLM-5.1 推理集群的网络硬件成本降低 33%，平均吞吐量提升 15%，目前已稳定运行超两周。

Z.ai、Harnets.AI 与清华大学联合开发了名为 ZCube 的新一代 LLM 推理网络架构，并已将其部署于线上生产集群。该架构采用完全扁平化的拓扑结构，旨在解决传统架构在 Prefill-Decode 分离场景下因流量不对称导致的网络拥塞问题。根据官方提供的基准测试数据，在运行 GLM-5.1 推理服务时，ZCube 在降低约三分之一交换机及光模块硬件成本的同时，使平均 GPU 推理吞吐量提升了 15%，并将 TTFT P99 尾部延迟降低了 40.6%。该生产集群目前已在无应用层修改的情况下稳定运行超过两周，其相关论文已在 ACM SIGCOMM 2025 发表。

相关链接：

https://x.com/Zai_org/status/2057216685040443743

行业动态

DeepSeek 组建 Harness 团队，招聘中 `#8`

据DeepSeek工作人员透露，DeepSeek正在组建一个新的Harness团队做Harness方向的产品和研究。目前正在招聘产品和研发方向的两个岗位。

DeepSeek 正在内部组建新团队，Harness方向的产品和研究。该公司已在官方招聘平台开放了“Agent Harness 产品经理”和“Agent Harness 研发工程师”两个职位，工作地点目前仅限北京。DeepSeek 资深研究员陈德里在社交媒体上证实了这一动向，明确提出要“对标 Claude Code，做 DeepSeek Code Harness”。

Exa 完成 2.5 亿美元 C 轮融资，估值达 22 亿美元 `#9`

AI 搜索引擎公司 Exa 完成 2.5 亿美元 C 轮融资，估值达 22 亿美元，由 a16z 领投，致力于为 AI Agent 构建专属搜索引擎。

Exa 官方宣布完成 2.5 亿美元 C 轮融资，估值达到 22 亿美元，本轮由 a16z 领投。该公司从零构建了专为 AI Agent 设计的搜索堆栈，提供低于 200 毫秒的搜索延迟及定制的嵌入模型，目前已为 Cursor 等超 5000 家企业及 40 万开发者提供支持。面对未来大语言模型预计千倍于传统搜索的需求量，Exa 计划利用新资金训练下一代模型，将基础设施扩展至每秒处理十万次搜索，并拓展全球市场团队。

相关链接：

OpenAI 推出“OpenAI for Singapore”多年期合作计划 `#10`

OpenAI 宣布推出“OpenAI for Singapore”合作计划，承诺投入超3亿新元，并设立其美国境外的首个 Applied AI Lab 以支持该国国家 AI 战略。

OpenAI 宣布推出“OpenAI for Singapore”多年期合作计划，以支持新加坡国家 AI 战略。根据官方公告，该计划承诺投入超 3 亿新元资金，将在当地设立 OpenAI 首个美国境外的 Applied AI Lab，并在未来几年创造 200 多个技术岗位。此项合作将重点聚焦前沿 AI 部署、本土 AI 人才培养以及赋能本地中小企业与初创公司。

相关链接：

https://openai.com/index/introducing-openai-for-singapore/

前瞻与传闻

报道称 OpenAI 计划最快本周提交 IPO 申请 `#11`

媒体报道称，OpenAI计划在未来几天或几周内提交IPO申请，传闻估值最高达2万亿美元，预计最快于9月上市。

据《华尔街日报》报道，OpenAI正准备在未来的几天或几周内向监管机构秘密提交首次公开募股（IPO）申请。首席执行官Sam Altman希望公司能在今年9月前准备好上市，目前该公司正与Goldman Sachs和Morgan Stanley合作处理相关事宜。科技圈及社交媒体传闻其IPO估值可能在1万亿至2万亿美元之间。

相关链接：

消息称白宫已向 OpenAI 等企业通报前沿 AI 模型审查计划 `#12`

据媒体报道，白宫向多家 AI 公司通报了一项行政令计划，拟建立自愿审查框架，要求企业在发布前沿模型前最多提前 90 天与政府共享。

据 The Information 报道，白宫国家网络总监办公室近期为主流 AI 企业举办了一场简报会，讨论一项旨在审查高级 AI 模型的行政命令。参会企业包括 OpenAI、Anthropic 和 Reflection AI。该报道指出，这项预计最快将于本周签署的行政令旨在建立一个自愿框架，授权情报等政府机构在模型发布前进行评估，并要求前沿模型开发者在重大发布前通知政府，且最多可提前 90 天将模型共享给政府。

相关链接：

https://www.reuters.com/legal/litigation/white-house-briefs-ai-firms-plans-model-review-information-reports-2026-05-20/

提示：内容由AI辅助创作，可能存在幻觉和错误。

AI 早报 2026-05-21

概览

产品应用

模型发布

技术与洞察

行业动态

前瞻与传闻

产品应用

Hugging Face 上线 Hardware 页面及模型参数筛选功能 #1

Google 发布跨平台 Agent Ask Advisor 及多项广告 AI 更新 #2

模型发布

千问发布新一代旗舰 Qwen3.7-Max，即将上线百炼 API #3

Cohere 发布开源模型 Command A+ #4

Stability AI 发布 Stable Audio 3.0 系列音频模型 #5

NVIDIA 推出 SANA-WM 分钟级视频生成模型 #6

技术与洞察

Z.ai 等联合部署 ZCube 网络架构：推理吞吐提升 15% #7

行业动态

DeepSeek 组建 Harness 团队，招聘中 #8

Exa 完成 2.5 亿美元 C 轮融资，估值达 22 亿美元 #9

OpenAI 推出“OpenAI for Singapore”多年期合作计划 #10

前瞻与传闻

报道称 OpenAI 计划最快本周提交 IPO 申请 #11

消息称白宫已向 OpenAI 等企业通报前沿 AI 模型审查计划 #12

Hugging Face 上线 Hardware 页面及模型参数筛选功能 `#1`

Google 发布跨平台 Agent Ask Advisor 及多项广告 AI 更新 `#2`

千问发布新一代旗舰 Qwen3.7-Max，即将上线百炼 API `#3`

Cohere 发布开源模型 Command A+ `#4`

Stability AI 发布 Stable Audio 3.0 系列音频模型 `#5`

NVIDIA 推出 SANA-WM 分钟级视频生成模型 `#6`

Z.ai 等联合部署 ZCube 网络架构：推理吞吐提升 15% `#7`

DeepSeek 组建 Harness 团队，招聘中 `#8`

Exa 完成 2.5 亿美元 C 轮融资，估值达 22 亿美元 `#9`

OpenAI 推出“OpenAI for Singapore”多年期合作计划 `#10`

报道称 OpenAI 计划最快本周提交 IPO 申请 `#11`

消息称白宫已向 OpenAI 等企业通报前沿 AI 模型审查计划 `#12`