2026-05-21 · Markdown

AI 早报 2026-05-21

视频版哔哩哔哩YouTube

概览

产品应用

模型发布

技术与洞察

行业动态

前瞻与传闻


产品应用

Hugging Face 上线 Hardware 页面及模型参数筛选功能 #1

Hugging Face 宣布为 Dataset Leaderboard 新增按模型参数量级筛选基准测试结果的功能,并推出用于展示开源 AI 社区真实硬件使用情况的 Hugging Face Hardware。

Hugging Face 官方宣布为 Dataset Leaderboard 新增了按模型参数范围筛选基准测试结果的功能,帮助用户查找特定参数限制下的最优模型。同时,其联合创始人 Julien Chaumond 宣布推出 Hugging Face Hardware,旨在呈现开源 AI 生态系统的真实世界硬件运行情况。该硬件追踪功能将提供热门 GPU 与 CPU 统计、VRAM 分布情况以及推理硬件的发展趋势。

相关链接:


Google 发布跨平台 Agent Ask Advisor 及多项广告 AI 更新 #2

Google 连续发布多项广告与营销 AI 更新,宣布跨产品Agent “Ask Advisor” 现已面向英文账户推出测试版,Asset Studio 即将集成 Gemini Omni 模型,并在 AI Mode 中测试多种由 Gemini 驱动的新型广告格式。

Google 宣布了一系列针对其广告与营销平台的 AI 更新,旨在统一用户体验并提升广告互动性。该公司推出了跨产品 Agent Ask Advisor 以连接 Google Ads、Analytics 和 Merchant Center,为 Asset Studio 引入了多模态功能并即将整合 Gemini Omni,同时还在测试由 Gemini 模型驱动的新型搜索广告格式。目前 Ask Advisor 仅限英文账户参与测试,Asset Studio 的新功能将于今年夏季面向全球英语用户推出,而新的搜索广告格式和扩展的 Direct Offers 试点正处于测试或逐步推进阶段。

相关链接:


模型发布

千问发布新一代旗舰 Qwen3.7-Max,即将上线百炼 API #3

Qwen 团队正式发布面向 Agent 时代的旗舰模型 Qwen3.7-Max,主打编程、办公自动化与长周期自主执行能力。官方称,该模型在编程 Agent、通用 Agent 及高难度推理等多个评测维度表现领先,即将通过阿里云百炼 API 上线。

阿里千问正式发布新一代旗舰模型 Qwen3.7-Max,定位为面向 Agent 时代的全能基座模型。官方称,该模型在编程 Agent、通用 Agent 及高难度推理等多个评测维度表现领先或居前,在一项 35 小时、1158 次工具调用的自主 kernel 优化实验中实现相对参考实现 10.0 倍的几何平均加速。该模型采用任务-运行框架-验证器正交解耦训练架构,原生适配 Claude Code、OpenClaw、Qwen Code 等主流智能体框架,支持 MCP 集成与多智能体协作,并可通过工具调用操控机器狗等具身设备。API 即将通过阿里云百炼上线。

相关链接:


Cohere 发布开源模型 Command A+ #4

Cohere发布开源大模型Command A+。该模型采用218B总参数和25B激活参数的MoE架构,它整合了前代视觉与推理能力,专精Agentic任务。

Cohere 发布开源大模型 Command A+,该模型基于 Apache 2.0 许可,采用 218B 总参与 25B 激活参的 Sparse MoE 架构。官方称,该模型统一了前代 Command A 系列能力,支持 128K 上下文、64K 输出、图像输入及 48 种语言,专为 Agentic 任务与高性能企业环境优化。模型提供 BF16、FP8 和 W4A4 三种量化版本,通过引入推测解码和新分词器提升了推理效率。官方推荐的 W4A4 版本最低仅需单块 B200 或两块 H100 GPU 即可运行,目前权重已在 Hugging Face 发布。

相关链接:


Stability AI 发布 Stable Audio 3.0 系列音频模型 #5

Stability AI 发布 Stable Audio 3.0 系列音频生成模型,提供多个规格,其中小号与中号版本以开放权重形式发布,支持最长 6 分钟的音频生成,可在一定限制下免费商用。

Stability AI 推出了名为 Stable Audio 3.0 的音频生成模型系列。该系列共包含四个模型,基于新的语义-声学自编码器架构构建,旨在实现可变长度的音频生成与编辑。其中,small SFX、small 与 medium 三个模型的权重已开放,large 模型则仅通过 API 及付费自托管服务提供。官方表示,用户对生成内容的输出拥有所有权,年收入低于 100 万美元的用户可根据社区许可证进行分发与商业化。公司同时开放了面向专业音乐家的产品套件候补名单。

相关链接:


NVIDIA 推出 SANA-WM 分钟级视频生成模型 #6

NVIDIA 开源世界模型 SANA-WM,支持基于单张图像与摄像机轨迹,在单块 GPU 上生成 720p 分辨率的 60 秒可控视频。

NVIDIA 研究团队发布了名为 SANA-WM 的开源世界模型,该模型原生支持一分钟时长的视频生成。SANA-WM 包含 26 亿参数,能够接收单张图像、文本提示词以及精确的 6 自由度摄像机轨迹作为输入,进而合成 720p 分辨率的高保真视频。其架构核心采用混合线性注意力机制与双分支摄像机控制设计,并结合了两阶段生成管道。官方称,该模型在单块 H100 GPU 上即可完成一分钟视频的推理,而其经过蒸馏与 NVFP4 量化的变体更可在单块 RTX 5090 上仅需 34 秒完成 60 秒 720p 视频的去噪。目前,该模型的双向检查点、推理代码及相关组件已在 Hugging Face 上正式开源。

相关链接:


技术与洞察

Z.ai 等联合部署 ZCube 网络架构:推理吞吐提升 15% #7

智谱与相关机构联合开发并在生产环境部署了 ZCube 网络架构。官方数据显示,该架构使 GLM-5.1 推理集群的网络硬件成本降低 33%,平均吞吐量提升 15%,目前已稳定运行超两周。

Z.ai、Harnets.AI 与清华大学联合开发了名为 ZCube 的新一代 LLM 推理网络架构,并已将其部署于线上生产集群。该架构采用完全扁平化的拓扑结构,旨在解决传统架构在 Prefill-Decode 分离场景下因流量不对称导致的网络拥塞问题。根据官方提供的基准测试数据,在运行 GLM-5.1 推理服务时,ZCube 在降低约三分之一交换机及光模块硬件成本的同时,使平均 GPU 推理吞吐量提升了 15%,并将 TTFT P99 尾部延迟降低了 40.6%。该生产集群目前已在无应用层修改的情况下稳定运行超过两周,其相关论文已在 ACM SIGCOMM 2025 发表。

相关链接:


行业动态

DeepSeek 组建 Harness 团队,招聘中 #8

据DeepSeek工作人员透露,DeepSeek正在组建一个新的Harness团队做Harness方向的产品和研究。目前正在招聘产品和研发方向的两个岗位。

DeepSeek 正在内部组建新团队,Harness方向的产品和研究。该公司已在官方招聘平台开放了“Agent Harness 产品经理”和“Agent Harness 研发工程师”两个职位,工作地点目前仅限北京。DeepSeek 资深研究员陈德里在社交媒体上证实了这一动向,明确提出要“对标 Claude Code,做 DeepSeek Code Harness”。


Exa 完成 2.5 亿美元 C 轮融资,估值达 22 亿美元 #9

AI 搜索引擎公司 Exa 完成 2.5 亿美元 C 轮融资,估值达 22 亿美元,由 a16z 领投,致力于为 AI Agent 构建专属搜索引擎。

Exa 官方宣布完成 2.5 亿美元 C 轮融资,估值达到 22 亿美元,本轮由 a16z 领投。该公司从零构建了专为 AI Agent 设计的搜索堆栈,提供低于 200 毫秒的搜索延迟及定制的嵌入模型,目前已为 Cursor 等超 5000 家企业及 40 万开发者提供支持。面对未来大语言模型预计千倍于传统搜索的需求量,Exa 计划利用新资金训练下一代模型,将基础设施扩展至每秒处理十万次搜索,并拓展全球市场团队。

相关链接:


OpenAI 推出“OpenAI for Singapore”多年期合作计划 #10

OpenAI 宣布推出“OpenAI for Singapore”合作计划,承诺投入超3亿新元,并设立其美国境外的首个 Applied AI Lab 以支持该国国家 AI 战略。

OpenAI 宣布推出“OpenAI for Singapore”多年期合作计划,以支持新加坡国家 AI 战略。根据官方公告,该计划承诺投入超 3 亿新元资金,将在当地设立 OpenAI 首个美国境外的 Applied AI Lab,并在未来几年创造 200 多个技术岗位。此项合作将重点聚焦前沿 AI 部署、本土 AI 人才培养以及赋能本地中小企业与初创公司。

相关链接:


前瞻与传闻

报道称 OpenAI 计划最快本周提交 IPO 申请 #11

媒体报道称,OpenAI计划在未来几天或几周内提交IPO申请,传闻估值最高达2万亿美元,预计最快于9月上市。

据《华尔街日报》报道,OpenAI正准备在未来的几天或几周内向监管机构秘密提交首次公开募股(IPO)申请。首席执行官Sam Altman希望公司能在今年9月前准备好上市,目前该公司正与Goldman Sachs和Morgan Stanley合作处理相关事宜。科技圈及社交媒体传闻其IPO估值可能在1万亿至2万亿美元之间。

相关链接:


消息称白宫已向 OpenAI 等企业通报前沿 AI 模型审查计划 #12

据媒体报道,白宫向多家 AI 公司通报了一项行政令计划,拟建立自愿审查框架,要求企业在发布前沿模型前最多提前 90 天与政府共享。

据 The Information 报道,白宫国家网络总监办公室近期为主流 AI 企业举办了一场简报会,讨论一项旨在审查高级 AI 模型的行政命令。参会企业包括 OpenAI、Anthropic 和 Reflection AI。该报道指出,这项预计最快将于本周签署的行政令旨在建立一个自愿框架,授权情报等政府机构在模型发布前进行评估,并要求前沿模型开发者在重大发布前通知政府,且最多可提前 90 天将模型共享给政府。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误