2026-05-22 · Markdown

AI 早报 2026-05-22

视频版：哔哩哔哩｜ YouTube

概览

要闻

DeepSeek 引入 API 并发限制和 user_id 隔离 ↗ #1
OpenAI 发布 Codex 多项更新，上线 Appshots 与锁屏控制控制功能 ↗ #2
Antigravity 永久提升 Gemini 模型速率限制并重置周配额 #3

产品应用

OpenAI推出ChatGPT for PowerPoint测试版 ↗ #4
MiniMax Agent 集成 Perplexity Search ↗ #5

模型发布

网易有道开源多模态数学推理模型 Confucius4 ↗ #6
美团开源 LongCat-Video-Avatar-1.5 框架 ↗ #7
Runway 发布 Aleph 2.0 及 Edit Studio ↗ #8

开发生态

SpaceXAI宣布OpenCode支持接入Grok订阅 ↗ #9
Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 ↗ #10
Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API ↗ #11
OpenClaw 发布 2026.5.20 版本更新 ↗ #12

行业动态

Modal 完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元 ↗ #13

前瞻与传闻

消息称月之暗面启动拆除VIE架构冲刺赴港IPO #14

要闻

DeepSeek 引入 API 并发限制和 user_id 隔离 `#1`

DeepSeek更新API文档，明确deepseek-v4-pro与deepseek-v4-flash并发上限为500和2500，超限报错可免费扩容。新增user_id隔离，实现内容安全与KVCache调度隔离，扩容账号按此独立限速。此外，还增加了请求保活机制。

DeepSeek 官方 API 文档新增限速与隔离细则，规定了不同模型的并发限制与保活机制。在账号粒度上，deepseek-v4-pro 并发限制为 500，deepseek-v4-flash 为 2500，超出限制会返回 HTTP 429 错误码，用户可提交工单免费申请扩容。API 同时引入了 user_id 隔离功能，用于实现不同终端用户的内容安全、KVCache 及调度隔离，且对扩容账号会按 user_id 维度进行独立并发限速。此外，请求在等待期间会通过特定格式保活，若 10 分钟仍未开始推理服务器将关闭连接。

相关链接：

https://api-docs.deepseek.com/zh-cn/quick_start/rate_limit

OpenAI 发布 Codex 多项更新，上线 Appshots 与锁屏控制控制功能 `#2`

OpenAI发布Codex应用多项更新。Appshots功能支持一键截取窗口画面与文本。/goal指令正式上线。Computer Use新增锁定模式，允许用手机远程操控已锁屏的Mac，Business版新增支持共享自定义插件。

OpenAI 集中发布了针对编程工具 Codex 应用的多项功能更新。官方正式推出 Appshots 功能，允许用户在 Mac 上通过双击 Command 键一键提取当前应用窗口的截图及完整文本上下文。同时 /goal 指令结束实验阶段，支持 Codex 持续数小时甚至数天处理长任务，目前部分用户可能需手动运行命令来激活该功能。此外，Computer Use 新增锁定使用能力，允许用户通过手机等设备远程操控已锁屏的 Mac 主机，Business 版用户也已获准在团队内共享自定义插件。

相关链接：

Antigravity 永久提升 Gemini 模型速率限制并重置周配额 `#3`

Google宣布，Antigravity 已将所有付费层级中 Gemini 模型的速率限制永久提升 3 倍，并重置了所有用户本周的 Gemini 配额，以回应用户快速触及限制的反馈。

Google 宣布，Antigravity 已将所有付费层级中 Gemini 模型的速率限制永久提升 3 倍，并重置了所有用户本周的配额。官方表示此举旨在回应用户过快达到限制的反馈，以便用户进一步测试 3.5 Flash 模型。针对 Antigravity 2.0 更新导致 IDE 消失、丢失配置的问题，工作人员承认发布不够顺利，将发布更新进行修复。

产品应用

OpenAI推出ChatGPT for PowerPoint测试版 `#4`

OpenAI推出ChatGPT for PowerPoint测试版插件，支持在PPT内直接创建、编辑幻灯片及生成图像，现已面向全球多数用户开放。

OpenAI官方宣布推出“ChatGPT for PowerPoint”加载项测试版，用户可直接在PowerPoint中调用ChatGPT创建、编辑演示文稿及生成图像。该工具不仅能基于文档或提示词生成新幻灯片，还能分析现有内容结构、提取关键信息并保持幻灯片可编辑状态。目前该功能已面向全球的ChatGPT Free、Plus、Pro、Business、Enterprise及Edu等各级别用户开放，用户需通过Office加载项商店安装并登录OpenAI账号使用。

相关链接：

https://chatgpt.com/apps/powerpoint/

MiniMax Agent 集成 Perplexity Search `#5`

MiniMax Agent 官方宣布已集成并上线 Perplexity AI Search。官方数据显示，该搜索方案较原默认服务总成本降低 27%，且通过率提升 2%。

官方宣布 MiniMax Agent 现已集成并上线 Perplexity AI Search。官方称在 700 多个 Agent 任务的基准测试中，Perplexity 提供了最佳的答案质量与片段密度。与之前的默认服务 Serper 相比，新集成使总成本降低 27%，工具调用次数减少 45%，Token 使用量下降 42%，且通过率提升 2%。官方指出，高质量的搜索片段能提供更好的基础，从而有效减少 Agent 工作流中的循环搜索次数。

相关链接：

https://x.com/MiniMaxAgent/status/2057491132133904739

模型发布

网易有道开源多模态数学推理模型 Confucius4 `#6`

网易有道开源多模态数学推理模型“子曰4”。该模型基于 Qwen3.5-27B，官方称其在视觉数理基准测试中达到同规模 SOTA 水平，并将思维链长度减少约 43.2%。

网易有道 AI 团队已正式开源专为数学推理设计的多模态大模型 “子曰4”，该项目基于 Qwen3.5-27B 进行二次开发并遵循 Apache 2.0 协议。该模型采用“监督微调（SFT）+强化学习（RL）”的迭代训练框架，官方数据显示其在多个视觉数理基准上达到同尺寸模型的最佳水平，并在内部闭源数据集 Math-Hard-500 上实现了 23.2% 的性能提升。为解决推理过度思考的问题，团队通过引入长度感知强化学习等机制，使整体思维链减少了 43.2%，从而降低了解题成本与响应时间。

相关链接：

美团开源 LongCat-Video-Avatar-1.5 框架 `#7`

美团 LongCat 团队开源了音频驱动数字人视频生成框架 LongCat-Video-Avatar-1.5。新版本将音频编码器升级为 Whisper-large-v3，并通过步数蒸馏技术将推理加速至 8 步。

美团 LongCat 团队正式发布了 LongCat-Video-Avatar-1.5 框架及对应权重。该版本采用 Whisper-large-v3 替代原有的 Wav2Vec2 音频编码器，以提升唇形同步的准确度与自然度，原生支持音频文本到视频、音频图像到视频及视频续写任务，并能够泛化至动漫、动物及多人交互等复杂场景。官方通过基于 508 对测试数据和 770 名评估者的人类评估基准宣称，该模型在写实度、稳定性和自然度上表现优异。模型默认强制开启基于 DMD2 的 8 步蒸馏推理，并提供 INT8 量化选项以降低显存占用，虽然模型权重遵循 MIT 协议开源，但官方明确要求其生成的演示内容仅限学术使用，不得用于商业用途。

相关链接：

Runway 发布 Aleph 2.0 及 Edit Studio `#8`

Runway 官方发布旗舰视频编辑模型升级版 Aleph 2.0 及新产品 Edit Studio。该模型支持最长 30 秒 1080p 视频处理，具备局部精准修改及跨镜头编辑等能力，目前已在桌面网页端向所有付费用户开放。

Runway 官方宣布推出其旗舰视频编辑模型的升级版 Aleph 2.0，并同步上线专为该模型打造的新产品体验 Edit Studio。Aleph 2.0 现已支持处理时长上限为 30 秒的 1080p 视频素材，并在编辑过程中能精准保留原视频未修改的细节，避免多余的画面变动。同时，新模型引入了图像级别的控制能力，用户可通过修改单帧画面来指导视频的最终呈现效果，且支持在包含多次场景切换的视频中跨多个镜头一次性应用编辑。Edit Studio 允许用户在正式生成前将修改效果作为图像进行预览，从而减少试错成本并加快迭代速度。目前，上述功能已面向所有 Runway 付费计划的用户开放，可通过桌面网页端使用。

相关链接：

https://runwayml.com/news/introducing-aleph-2-and-edit-studio

开发生态

SpaceXAI宣布OpenCode支持接入Grok订阅 `#9`

SpaceXAI 宣布用户现已能在 OpenCode 中使用 SuperGrok 或 X Premium 订阅。接入后可直接使用 Grok Build 模型进行编码。

SpaceXAI 宣布用户现已能在 OpenCode 中使用其 SuperGrok 或 X Premium 订阅。接入后，用户可使用驱动 Grok Build 的底层模型进行编码，该模型与 SpaceXAI 基于终端的编码 Agent 采用同一模型，旨在提供高速度和代码库智能支持。用户只需在 OpenCode 中执行 /connect 命令并选择“xAI”，即可根据设备环境选择通过浏览器或无头模式完成身份验证。SpaceXAI 同时预告，未来将推出更多开源 Agent 和集成功能。

相关链接：

https://x.ai/news/grok-opencode

Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 `#10`

Google 官方宣布推出 ADK for Kotlin 和 ADK for Android 的 0.1.0 版本，开发者可利用该开源框架在后端或 Android 应用内构建 AI Agent。

Google 官方宣布推出用于开发和运行 AI Agent 的开源框架 ADK for Kotlin 与 ADK for Android 的 0.1.0 版本。其中，ADK for Kotlin 面向后端项目，而 ADK for Android 提供专门的端侧优化，允许开发者利用本地大语言模型在设备上直接运行 Agent，在保护隐私的同时保持与云端模型交互的灵活性。此次发布的首个实验性版本包含了完整的构建基础，支持混合编排、MCP Tools、A2A 以及多种 Agent 类型与运行时管理功能。

相关链接：

https://developers.googleblog.com/adk-kotlin-android-building-ai-agents/

Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API `#11`

Anthropic 发布了多家安全厂商将 Claude Opus 模型应用于网络安全防御的早期测试数据，并面向Claude Enterprise正式推出 Claude Compliance API。

Anthropic 官方公布了 Wiz、Palo Alto Networks 和 Accenture 等合作伙伴利用 Claude Opus 进行漏洞挖掘与修复的早期成果。根据官方提供的数据，Accenture 内部的安全测试覆盖率已从约 10% 提升至 80% 以上，扫描周转时间从 3 到 5 天缩短至不到 1 小时。同时，Anthropic 发布了 Claude Compliance API，提供对 Claude Enterprise 对话内容及平台活动日志的编程访问接口。目前，包含 CrowdStrike 和 Microsoft Purview 在内的 28 款外部安全与合规工具已完成集成并向企业客户开放。

相关链接：

OpenClaw 发布 2026.5.20 版本更新 `#12`

OpenClaw 官方发布 2026.5.20 版本更新，该版本新增了 Discord 语音跨频道跟随用户、敏感明文密钥警告提示，并修复了 Windows 安装界面冻结及无头设备 SpaceXAI 登录验证等问题。

OpenClaw 官方正式发布 2026.5.20 版本更新，本次主要聚焦于底层体验与安全性的修复。更新后，Discord 语音会话支持自动跟随配置用户跨频道移动并进行多人切换，Doctor 工具会在配置文件包含明文密钥时发出警告，且模型固定状态提示变得更加清晰。此外，此次更新解决了 Windows 环境安装时卡顿的问题，并引入了设备代码 OAuth 来简化无头设备上的 SpaceXAI 登录验证。

相关链接：

https://github.com/openclaw/openclaw/releases/tag/v2026.5.20

行业动态

Modal 完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元 `#13`

云平台 Modal 宣布完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元。官方称其年化收入已超 3 亿美元，未来将重点扩展大规模低延迟推理与 Agent 计算层。

官方宣布，为 AI 工作负载构建云平台的 Modal 完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元，本轮融资由 General Catalyst 和 Redpoint 领投。官方称，自去年九月以来其业务增长五倍，年化收入已超过 3 亿美元，且平台已累计启动超 10 亿个用于运行 AI 代码的隔离环境。该公司计划利用新资金推进大规模低延迟推理、强化学习循环整合以及构建 Agent 计算层，并将通过推出细粒度 RBAC 来安全赋能 Agent 开发。

相关链接：

https://modal.com/blog/modal-series-c

前瞻与传闻

消息称月之暗面启动拆除VIE架构冲刺赴港IPO `#14`

据报道，月之暗面完成20亿美元新一轮融资后，已正式通知股东启动拆除VIE及红筹架构，旨在为赴港IPO扫清障碍，其投后估值已突破200亿美元。

据媒体报道，月之暗面在完成20亿美元新融资后，已正式向股东发出通知启动架构重组，核心动作是拆除现有的VIE及红筹架构，以期为赴香港证券交易所IPO扫清监管障碍。据知情人士透露，该公司计划解散相关离岸实体并建立合资企业结构，从而在合规的同时保留外资投资者权益。在资本层面，月之暗面过去6个月累计融资约39亿美元，投后估值突破200亿美元，而在业务端其年度经常性收入也已突破2亿美元。

提示：内容由AI辅助创作，可能存在幻觉和错误。

AI 早报 2026-05-22

概览

要闻

产品应用

模型发布

开发生态

行业动态

前瞻与传闻

要闻

DeepSeek 引入 API 并发限制和 user_id 隔离 #1

OpenAI 发布 Codex 多项更新，上线 Appshots 与锁屏控制控制功能 #2

Antigravity 永久提升 Gemini 模型速率限制并重置周配额 #3

产品应用

OpenAI推出ChatGPT for PowerPoint测试版 #4

MiniMax Agent 集成 Perplexity Search #5

模型发布

网易有道开源多模态数学推理模型 Confucius4 #6

美团开源 LongCat-Video-Avatar-1.5 框架 #7

Runway 发布 Aleph 2.0 及 Edit Studio #8

开发生态

SpaceXAI宣布OpenCode支持接入Grok订阅 #9

Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 #10

Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API #11

OpenClaw 发布 2026.5.20 版本更新 #12

行业动态

Modal 完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元 #13

前瞻与传闻

消息称月之暗面启动拆除VIE架构 冲刺赴港IPO #14

DeepSeek 引入 API 并发限制和 user_id 隔离 `#1`

OpenAI 发布 Codex 多项更新，上线 Appshots 与锁屏控制控制功能 `#2`

Antigravity 永久提升 Gemini 模型速率限制并重置周配额 `#3`

OpenAI推出ChatGPT for PowerPoint测试版 `#4`

MiniMax Agent 集成 Perplexity Search `#5`

网易有道开源多模态数学推理模型 Confucius4 `#6`

美团开源 LongCat-Video-Avatar-1.5 框架 `#7`

Runway 发布 Aleph 2.0 及 Edit Studio `#8`

SpaceXAI宣布OpenCode支持接入Grok订阅 `#9`

Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 `#10`

Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API `#11`

OpenClaw 发布 2026.5.20 版本更新 `#12`

Modal 完成 3.55 亿美元 C 轮融资，投后估值达 46.5 亿美元 `#13`

消息称月之暗面启动拆除VIE架构冲刺赴港IPO `#14`