![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/imagehub/20260224/20260224083348368944db06_cover_52c1.png)

# OpenAI 上线 gpt-realtime-1.5 语音模型【AI 早报 2026-02-24】

**视频版**：[哔哩哔哩](https://www.bilibili.com/video/BV1LHfrBxEUR) ｜ [YouTube](https://www.youtube.com/watch?v=f6f9gRLCaZ8)

## 概览
### 产品应用
- Gemini 上线视频模板功能 [↗](https://x.com/GeminiApp/status/2026001595708866759) `#1`
- openclaw 发布 2026.2.22 版本 [↗](https://github.com/openclaw/openclaw/releases/tag/v2026.2.22) `#2`
### 模型发布
- OpenAI 在 Realtime API 中上线 gpt-realtime-1.5 语音模型 [↗](https://x.com/OpenAIDevs/status/2026014334787461508) `#3`
- Guide Labs 推出可解释因果扩散语言模型 Steerling-8B [↗](https://github.com/guidelabs/steerling) `#4`
### 开发生态
- OpenAI Responses API 新增 WebSocket 模式 [↗](https://developers.openai.com/api/docs/guides/websocket-mode) `#5`
- Google 回应封禁滥用 Antigravity 的 Gemini 订阅用户 [↗](https://x.com/_mohansolo/status/2025766889205739899) `#6`
- Anthropic 推广 COBOL 代码自动化迁移方案 [↗](https://claude.com/blog/how-ai-helps-break-cost-barrier-cobol-modernization) `#7`
### 技术与洞察
- OpenAI 宣布停用 SWE-bench Verified 指标 [↗](https://openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/) `#8`
- Anthropic 发布 AI 流畅度指数报告 [↗](https://www.anthropic.com/research/AI-fluency-index) `#9`
### 行业动态
- Anthropic 指控三家中国 AI 实验室进行工业级模型蒸馏攻击 [↗](https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks) `#10`
- 五角大楼考虑终止与 Anthropic 的 AI 军事合同 [↗](https://www.axios.com/2026/02/23/hegseth-dario-pentagon-meeting-antrhopic-claude) `#11`
- OpenAI 联手四大咨询巨头 组建 Frontier 企业 AI 联盟 [↗](https://openai.com/index/frontier-alliance-partners/) `#12`
- 月之暗面 Kimi 近20天收入超2025全年 [↗](https://www.thepaper.cn/newsDetail_forward_32636837) `#13`
- Google for Education 为美国教育工作者免费提供 Gemini AI 培训 [↗](https://blog.google/products-and-platforms/products/education/teacher-ai-literacy-training/) `#14`
### 前瞻与传闻
- xAI 即将推出 Grok 4.20 Beta 2 以修复低级错误 [↗](https://x.com/elonmusk/status/2025756977440194673) `#15`

---

## 产品应用

### [Gemini 上线视频模板功能](https://x.com/GeminiApp/status/2026001595708866759) `#1`
> Google Gemini 在网页端和 App 端上线了基于 Veo 3.1 模型的视频模板功能。用户可直接套用 15 种预设风格生成视频。

Google Gemini 升级视频生成功能，引入基于 Veo 3.1 的预设模板，旨在简化创作流程，现已于网页端及 App 上线。用户通过“Create video”可选用 15 种风格模板，并结合图文进行深度自定义，支持原生 9:16 画幅。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/2a746286-24b1-41f3-a9e6-9a6e5c3346b6/m001.gif)

相关链接：
- [https://x.com/GeminiApp/status/2026001595708866759](https://x.com/GeminiApp/status/2026001595708866759)
- [https://9to5google.com/2026/02/23/gemini-video-templates/](https://9to5google.com/2026/02/23/gemini-video-templates/)

---

### [openclaw 发布 2026.2.22 版本](https://github.com/openclaw/openclaw/releases/tag/v2026.2.22) `#2`
> openclaw发布了2026.2.22版本，新增了对Mistral提供商的支持，涵盖内存嵌入与语音功能，并引入了原生Synology Chat插件。

openclaw 发布 2026.2.22 版本。此次更新新增 Mistral 提供商支持、Synology Chat 插件及可选的内置自动更新器。功能上，优化了多语言内存检索，重构 Browser 扩展以提升连接稳定性，支持 Cron 任务并行执行，并改善了 Webchat 渲染性能。安全方面集成 40 余项硬化修复，涵盖敏感数据脱敏、Exec 环境隔离、SSRF 防护及入站媒体限制。同时，该版本调整了 WSL2 与 Node22 兼容性，优化 OpenRouter 提示词缓存，并修复了 Docker 部署权限问题。

相关链接：
- [https://github.com/openclaw/openclaw/releases/tag/v2026.2.22](https://github.com/openclaw/openclaw/releases/tag/v2026.2.22)

---

## 模型发布

### [OpenAI 在 Realtime API 中上线 gpt-realtime-1.5 语音模型](https://x.com/OpenAIDevs/status/2026014334787461508) `#3`
> OpenAI已在Realtime API中正式上线gpt-realtime-1.5模型，该模型在音频平滑度、指令遵循、工具调用及多语言处理准确性等方面均有显著提升。

OpenAI 在其 Realtime API 中引入了最新的 gpt-realtime-1.5 模型。该模型专注于端到端语音交互体验的优化。据官方介绍，新模型在音频输出平滑度、指令遵循准确性、工具调用稳定性以及多语言处理能力上均有显著提升，能提供更自然的语音反馈，并更精准地执行用户指令和触发外部工具。目前，gpt-realtime-1.5 已正式上线供开发者调用。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/4633dd8b-0319-47f9-9ba8-d9f6fb94d55e/m001.png)

相关链接：
- [https://x.com/OpenAIDevs/status/2026014334787461508](https://x.com/OpenAIDevs/status/2026014334787461508)
- [https://x.com/pbbakkum/status/2025998657187991818](https://x.com/pbbakkum/status/2025998657187991818)

---

### [Guide Labs 推出可解释因果扩散语言模型 Steerling-8B](https://github.com/guidelabs/steerling) `#4`
> Guide Labs 发布了 80 亿参数的可解释因果扩散语言模型 Steerling-8B，该模型支持非自回归生成，允许开发者对预测结果进行概念层面的归因与干预。

Guide Labs发布80亿参数的可解释因果扩散语言模型Steerling-8B。该模型融合掩码扩散与概念分解技术，支持非自回归生成及概念层面的归因与干预。目前代码已在GitHub开源，权重已上传Hugging Face。

技术上，模型采用块因果注意力架构，上下文长4096，基于1.35万亿Token训练。官方计划未来发布技术报告及API服务，商业用途需单独联系。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/00f06eb0-1ef5-406d-a77d-72b3c7c0b4c5/m001.png)

相关链接：
- [https://github.com/guidelabs/steerling](https://github.com/guidelabs/steerling)
- [https://huggingface.co/guidelabs/steerling-8b](https://huggingface.co/guidelabs/steerling-8b)
- [https://techcrunch.com/2026/02/23/guide-labs-debuts-a-new-kind-of-interpretable-llm](https://techcrunch.com/2026/02/23/guide-labs-debuts-a-new-kind-of-interpretable-llm)

---

## 开发生态

### [OpenAI Responses API 新增 WebSocket 模式](https://developers.openai.com/api/docs/guides/websocket-mode) `#5`
> OpenAI 在 Responses API 中正式引入了 WebSocket 模式，该模式将长链条任务的执行速度提升了约 40%。

OpenAI 在 Responses API 中推出 WebSocket 模式，专为低延迟及高频工具调用的 Agent 任务设计。该模式通过持久连接仅传输增量数据，在包含 20 次以上工具调用的场景中，执行速度较传统 HTTP 提升约 40%。其核心利用连接本地内存缓存实现快速响应，并兼容零数据保留（ZDR）策略。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/3270575d-5aac-49bd-974f-08222181104d/m001.gif)

相关链接：
- [https://developers.openai.com/api/docs/guides/websocket-mode](https://developers.openai.com/api/docs/guides/websocket-mode)
- [https://x.com/TheRealAdamG/status/2026029238785036552](https://x.com/TheRealAdamG/status/2026029238785036552)

---

### [Google 回应封禁滥用 Antigravity 的 Gemini 订阅用户](https://x.com/_mohansolo/status/2025766889205739899) `#6`
> Google 因 Antigravity 后端遭恶意滥用，对部分通过 OAuth 使用 OpenClaw 调用 Gemini 模型的 AI Pro 和 Ultra 订阅用户实施了封禁。Antigravity 官方团队成员表示，后续将开放合规用户的申诉渠道。目前，OpenClaw 已计划移除相关支持。

Google 针对 Antigravity 后端遭大规模滥用，封禁了多名通过 OAuth 使用 OpenClaw 使用 Gemini 的 AI Pro/Ultra 订阅用户。Antigravity 官方成员 Varun Mohan 表示，此举旨在保障服务质量与真实用户权益，后续将开放合规用户申诉通道。OpenClaw 开发者批评 Google 手段严苛并表示将移除相关支持。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/96037bf6-bab1-42bf-a2ee-0c79c602ff46/m001.png)

相关链接：
- [https://x.com/_mohansolo/status/2025766889205739899](https://x.com/_mohansolo/status/2025766889205739899)

---

### [Anthropic 推广 COBOL 代码自动化迁移方案](https://claude.com/blog/how-ai-helps-break-cost-barrier-cobol-modernization) `#7`
> Anthropic 发布文章，介绍可利用 Claude Code 攻克 COBOL 遗留系统迁移难题，导致 IBM 股价暴跌。

Anthropic 发布《Code Modernization Playbook》并推广其 agentic coding 工具 Claude Code，指其能自动化 COBOL 语言的现代化改造。COBOL 诞生于 1959 年，目前支撑着美国约 95% 的 ATM 交易，全球数千亿行代码仍在金融、航空等关键系统中运行。

此举引发市场震动，市场将 Claude Code 定位为解决大型机遗留系统迁移成本瓶颈的方案，导致 IBM 股价在 2026 年 2 月 23 日跌幅达 13.2%，创下多年来的单日最大百分比跌幅。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/920740b4-b282-4a83-9c58-4f49adf7af4d/m001.png)

相关链接：
- [https://claude.com/blog/how-ai-helps-break-cost-barrier-cobol-modernization](https://claude.com/blog/how-ai-helps-break-cost-barrier-cobol-modernization)

---

## 技术与洞察

### [OpenAI 宣布停用 SWE-bench Verified 指标](https://openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/) `#8`
> OpenAI 宣布停止使用 SWE-bench Verified 指标来评估前沿模型，并建议全行业转向 SWE-bench Pro。理由是旧基准存在严重的测试用例缺陷和训练数据污染，导致模型能够直接“背诵”答案，评分也趋于饱和。

OpenAI宣布停止使用SWE-bench Verified指标，建议行业转向SWE-bench Pro。技术分析显示，该基准因测试用例缺陷及训练数据污染，已无法准确衡量模型真实进展。审计发现59.4%的被测问题存在测试设计缺陷，导致正确代码被拒；红蓝对抗实验证实多款前沿模型存在强污染，能复现原始修复方案。目前，OpenAI已改用SWE-bench Pro，并建议未来评估需严格执行污染测试、优化自动化评分及投资私有基准测试。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/3ca71848-fd3d-4986-8b8f-f85885c1268c/m001.png)

相关链接：
- [https://openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/](https://openai.com/index/why-we-no-longer-evaluate-swe-bench-verified/)

---

### [Anthropic 发布 AI 流畅度指数报告](https://www.anthropic.com/research/AI-fluency-index) `#9`
> Anthropic 发布“AI 流畅度指数”报告，通过量化指标衡量用户与 AI 协作的熟练程度。研究发现，尽管 85.7% 的用户具备反复迭代的良好协作习惯，但在处理代码或文档等结构化内容时，用户普遍因成品看似完备而产生评估盲区，导致对输出结果的审查意愿显著下降。

Anthropic 发布《AI 流畅度指数》报告，旨在量化人机协作熟练度。该研究基于 4D AI Fluency Framework，选取 11 项可观测指标，分析了 2025 年 1 月的 9830 个匿名对话样本。数据显示，85.7% 的用户具有“迭代与完善”习惯，协作把控力更强，但仅 30% 会设定明确协作条款。针对 Artifacts（代码或文档）的研究发现，用户虽指令更详尽，却因作品完备感导致审查意愿下降，存在评估盲区。此外，跨语言与时间测试显示数据稳定。Anthropic 计划后续开展同类群组分析及定性研究以弥补现有局限。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/9b474d21-d6b9-4982-86a8-e2a69779565e/m001.png)

相关链接：
- [https://www.anthropic.com/research/AI-fluency-index](https://www.anthropic.com/research/AI-fluency-index)

---

## 行业动态

### [Anthropic 指控三家中国 AI 实验室进行工业级模型蒸馏攻击](https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks) `#10`
> Anthropic 发布技术报告指控 DeepSeek、月之暗面与 MiniMax 合计利用约 2.4 万个账号对 Claude 模型发起模型蒸馏，累计产生超过 1600 万次交互，以获取 Agent 推理及编程等核心能力。Anthropic 称已通过行为指纹识别等手段加强防御。

Anthropic 发布报告指控 DeepSeek、月之暗面及 MiniMax 对 Claude 发起工业级蒸馏攻击。三家实验室利用约 2.4 万个虚假账号及代理网络绕过地区限制，产生超 1600 万次交互，非法提取 Agent 推理、编程等核心能力。其中，MiniMax 规模最大（超 1300 万次），月之暗面涉及推理轨迹提取（超 340 万次），DeepSeek 则聚焦逻辑与审查规避（约 15 万次）。

Anthropic 认为此举违反服务条款，规避出口管制并导致模型安全护栏失效，构成安全风险。目前，Anthropic 正通过流量分类、行为指纹及情报共享等措施强化防御，以降低模型被蒸馏的有效性。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/c9af5cd5-ceb8-43c3-9b4f-2b2b71a4238b/m001.png)

相关链接：
- [https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks](https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks)
- [https://x.com/AnthropicAI/status/2025997928242811253](https://x.com/AnthropicAI/status/2025997928242811253)

---

### [五角大楼考虑终止与 Anthropic 的 AI 军事合同](https://www.axios.com/2026/02/23/hegseth-dario-pentagon-meeting-antrhopic-claude) `#11`
> 五角大楼正因AI安全限制谈判陷入僵局而考虑终止与Anthropic的合作，国防部长Pete Hegseth已定于2026年2月24日召见Anthropic CEO，要求其取消对军事用途的限制。

五角大楼正在审议与人工智能公司 Anthropic 的合作关系，并考虑在双方关于 AI 使用安全限制的长期谈判陷入僵局后终止合同。国防部长 Pete Hegseth 已传唤 Anthropic CEO Dario Amodei 于 2026 年 2 月 24 日前往五角大楼参会，旨在就 AI 模型的军事化使用条款发出最后通牒。目前，Anthropic 的 Claude 模型是五角大楼分级网络中唯一可用的前沿模型，双方核心矛盾在于 Anthropic 拒绝取消针对“大规模监控”与“全自主武器”的使用限制。

在技术与合同层面，Anthropic 于 2025 年夏天与五角大楼签署了最高价值 2 亿美元的合同，其 Claude 是首个且唯一进入军方分级网络的前沿模型。

针对僵局，五角大楼已提出可能将 Anthropic 标记为“供应链风险”，该定性将废止现有合同并强制所有承包商剔除 Claude。尽管军方评估认为短期内完全替换 Claude 存在难度，但已考虑制定替换方案。

相关链接：
- [https://www.axios.com/2026/02/23/hegseth-dario-pentagon-meeting-antrhopic-claude](https://www.axios.com/2026/02/23/hegseth-dario-pentagon-meeting-antrhopic-claude)
- [https://www.axios.com/2026/02/19/anthropic-pentagon-ai-fight-openai-google-xai](https://www.axios.com/2026/02/19/anthropic-pentagon-ai-fight-openai-google-xai)

---

### [OpenAI 联手四大咨询巨头 组建 Frontier 企业 AI 联盟](https://openai.com/index/frontier-alliance-partners/) `#12`
> OpenAI 宣布与 BCG、麦肯锡、埃森哲及凯捷达成“Frontier Alliances”合作，旨在利用 Frontier 平台协助企业规模化部署 AI Coworkers。这一模式由 OpenAI 提供构建 Agent 的技术底座，合作伙伴提供战略与系统集成服务，共同解决企业 AI 难以从试点转化为实际生产价值的痛点。

OpenAI 官方宣布推出“Frontier Alliances”合作计划，与 Boston Consulting Group (BCG)、McKinsey & Company、Accenture 和 Capgemini 建立多年期合作伙伴关系，旨在协助企业利用 Frontier 平台在全球范围内部署 AI Coworkers。OpenAI 认为，企业从 AI 中获取价值的限制因素通常不在于模型智能，而在于 Agent 在组织内的构建和运行方式。此次合作旨在解决企业难以将 AI 从试点阶段转化为实际生产价值的痛点，OpenAI 提供构建和运行 AI 的技术基础 Frontier 平台，合作伙伴则负责提供战略制定、工作流重设计、系统集成及变革管理服务。目前 Frontier 平台仅向有限客户开放，预计未来几个月将扩大可用范围。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/c05f7f70-6bbf-47e1-91ae-ef2fef5d8bfe/m001.png)

相关链接：
- [https://openai.com/index/frontier-alliance-partners/](https://openai.com/index/frontier-alliance-partners/)
- [https://openai.com/index/introducing-openai-frontier/](https://openai.com/index/introducing-openai-frontier/)

---

### [月之暗面 Kimi 近20天收入超2025全年](https://www.thepaper.cn/newsDetail_forward_32636837) `#13`
> 据报道，月之暗面此前发布的K2.5大模型驱动Kimi近20天收入超越去年全年，增长动力来自全球付费用户及API调用量大幅提升，且海外收入已反超国内。

据澎湃新闻报道，大模型独角兽月之暗面估值突破100亿美元。据知情人士透露，Kimi近20天收入已超2025年全年，海外收入超国内，增长由全球付费用户及API调用量驱动。媒体报道称，该公司即将完成由阿里、腾讯等领投的超7亿美元新融资。

相关链接：
- [https://www.thepaper.cn/newsDetail_forward_32636837](https://www.thepaper.cn/newsDetail_forward_32636837)

---

### [Google for Education 为美国教育工作者免费提供 Gemini AI 培训](https://blog.google/products-and-platforms/products/education/teacher-ai-literacy-training/) `#14`
> Google for Education 宣布，将在未来几个月内面向全美教职员工推出免费的 Gemini 综合培训，帮助教育工作者学习利用 Gemini 和 NotebookLM 辅助生成教学材料。

Google for Education 与 ISTE+ASCD 宣布合作，将推出全美规模最大的免费 Gemini 综合培训计划。该计划旨在赋能 600 万名 K-12 及高等教育教职员工，帮助其及所服务的超 7400 万名学生安全、有效地使用 Gemini 和 NotebookLM。

培训模块由教育工作者构建，简短灵活，涵盖创建个性化课程、调整教学材料及使用 NotebookLM 辅助学习等现实用例。完成培训者将获微证书或徽章，内容符合 ISTE+ASCD 标准。官方博客显示，该计划将在未来几个月内推出，现已开放意向登记。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/796a7e23-3415-4172-9717-19a774f65c0f/m001.png)

相关链接：
- [https://blog.google/products-and-platforms/products/education/teacher-ai-literacy-training/](https://blog.google/products-and-platforms/products/education/teacher-ai-literacy-training/)
- [https://docs.google.com/forms/d/e/1FAIpQLSejyQW_BNSrpCS-7XTF6cKuCjIJCFb9Zg-dz7rXh_iE-sD4xw/viewform](https://docs.google.com/forms/d/e/1FAIpQLSejyQW_BNSrpCS-7XTF6cKuCjIJCFb9Zg-dz7rXh_iE-sD4xw/viewform)
- [https://edu.google.com/intl/ALL_us/](https://edu.google.com/intl/ALL_us/)

---

## 前瞻与传闻

### [xAI 即将推出 Grok 4.20 Beta 2 以修复低级错误](https://x.com/elonmusk/status/2025756977440194673) `#15`
> xAI 计划本周推出 Grok 4.20 Beta 2，重点修复前一版本中的各类问题。

xAI计划本周推出Grok 4.20 Beta 2，重点修复前一版本中的各类问题。官方尚未公布正式版时间表，有关配额调整、自定义提示词及独立应用等细节亦未披露。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/25ed3566-1579-4f6e-8719-b139e70af2df/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/52c1019b-9cdc-456f-bea8-242c5c8fa367/25ed3566-1579-4f6e-8719-b139e70af2df/m002.png)

相关链接：
- [https://x.com/elonmusk/status/2025756977440194673](https://x.com/elonmusk/status/2025756977440194673)
- [https://x.com/elonmusk/status/2025786369184788568](https://x.com/elonmusk/status/2025786369184788568)

---

**提示**：内容由AI辅助创作，可能存在**幻觉**和**错误**。