# AI 早报 2026-01-23

## 概览
### 产品应用
- 谷歌 AI Mode in Search 新增 Personal Intelligence 功能 [↗](https://blog.google/products-and-platforms/products/search/personal-intelligence-ai-mode-search/) `#1`
- 秘塔AI推出MetaLaw免费合同审查功能 [↗](https://meta.law) `#2`
### 模型发布
- Qwen团队开源Qwen3-TTS多语言语音合成模型 [↗](https://qwen.ai/blog?id=qwen3tts-0115) `#3`
- 百川智能发布医疗大模型M3 Plus [↗](https://mp.weixin.qq.com/s/tgowZrsp0IPCt1_vYgo0Aw) `#4`
- 百度发布文心大模型5.0正式版 [↗](https://x.com/Baidu_Inc/status/2014252300018254054) `#5`
### 开发生态
- Cua发布开源Computer-Use Agent 基础设施 [↗](https://github.com/trycua/cua) `#6`
- Gradium推出顶尖语音克隆技术 [↗](https://gradium.ai/blog/voice-cloning-sounds-fake) `#7`
- Anthropic发布Claude Code最佳实践指南 [↗](https://code.claude.com/docs/en/best-practices) `#8`
- 腾讯云发布CodeBuddy  Code 2.0 [↗](https://mp.weixin.qq.com/s/mXziYWAqRTP-I7UxmKyRTg) `#9`
- Cursor 2.4发布引入subagents功能 [↗](https://cursor.com/cn/changelog/2-4) `#10`
- OpenAI发布Codex CLI 0.89.0版本更新 [↗](https://developers.openai.com/codex/changelog) `#11`
- JetBrains IDE集成OpenAI Codex [↗](https://blog.jetbrains.com/ai/2026/01/codex-in-jetbrains-ides/) `#12`
### 技术与洞察
- 谷歌DeepMind 发文介绍 D4RT 4D重建模型 [↗](https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/) `#13`
### 行业动态
- OpenAI探索基于成果的盈利模式 [↗](https://x.com/sama/status/2014399391025574308) `#14`
- OpenAI正在寻求500亿美元新融资 [↗](https://www.bloomberg.com/news/articles/2026-01-21/openai-s-altman-meets-mideast-investors-for-50-billion-round) `#15`
- vLLM转型Inferact获1.5亿美元融资 [↗](https://inferact.ai/) `#16`
- DeepMind招聘经济学家研究AGI经济 [↗](https://x.com/ShaneLegg/status/2014345509675155639) `#17`
- cURL因LLM垃圾报告取消赏金计划 [↗](https://curl.se/.well-known/security.txt) `#18`

---

## 产品应用

### [谷歌 AI Mode in Search 新增 Personal Intelligence 功能](https://blog.google/products-and-platforms/products/search/personal-intelligence-ai-mode-search/) `#1`
> Google 推出 AI 搜索 Personal Intelligence 功能，支持连接 Gmail 和 Google Photos，提供个性化搜索。该功能以实验项目形式分阶段上线，美国地区符合条件的英文个人账户及 AI Pro/Ultra 用户可自动获得权限，支持手动开启。

Google在Search的AI Mode中推出Personal Intelligence功能，允许连接Gmail和Google Photos获取个性化搜索结果。该Labs实验正分阶段向美国地区、使用英文的AI Pro/Ultra订阅用户（个人账户）推送。用户可通过AI Mode内邀请或手动路径（Search→个人资料→Search personalization→Connected Content Apps）开启此功能。

![](https://storage.googleapis.com/gweb-uniblog-publish-prod/images/pcontext_sizzle_thumbnail.max-600x600.format-webp.webp)

相关链接：
- [https://blog.google/products-and-platforms/products/search/personal-intelligence-ai-mode-search/](https://blog.google/products-and-platforms/products/search/personal-intelligence-ai-mode-search/)

---

### [秘塔AI推出MetaLaw免费合同审查功能](https://meta.law) `#2`
> 秘塔AI发布MetaLaw，支持免费上传合同，选择立场后自动识别风险，覆盖租房及商业协议，一键生成带批注的Word文档，适配律师和法务工作流程。

秘塔AI推出MetaLaw，提供免费合同审查。用户上传合同并选择立场后可识别风险，支持个人租房及公司商业协议，生成Word批注/修订版，兼容律师法务流程。

相关链接：
- [https://meta.law](https://meta.law)
- [https://mp.weixin.qq.com/s/JGkPVD5rimZ6HTE279LXPg](https://mp.weixin.qq.com/s/JGkPVD5rimZ6HTE279LXPg)

---

## 模型发布

### [Qwen团队开源Qwen3-TTS多语言语音合成模型](https://qwen.ai/blog?id=qwen3tts-0115) `#3`
> Qwen团队开源Qwen3-TTS语音合成模型，含五款0.6B与1.7B参数模型，支持十种语言，支持音色克隆与自由设计，首字延迟仅97毫秒，支持自然语言控制音色情感，全模型支持微调。

Qwen团队开源Qwen3-TTS语音合成模型家族，包含VoiceDesign、CustomVoice、Base三种类型共5个模型，参数规模为0.6B和1.7B。该系列支持中文、英文、日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语、意大利语10种语言，具备自由形式语音设计与克隆能力。核心技术为自研SOTA 12Hz高压缩率tokenizer，采用端到端架构，支持流式与非流式生成，首字延迟低至97ms，可通过自然语言指令控制音色、情感等属性。CustomVoice提供9种预设音色，Base支持3秒快速语音克隆，VoiceDesign可根据文本描述生成全新音色。所有模型均支持全参数微调，并提供完整模型权重。

![](https://pbs.twimg.com/media/G_RS37LbwAA8twu?format=jpg&name=orig)

相关链接：
- [https://qwen.ai/blog?id=qwen3tts-0115](https://qwen.ai/blog?id=qwen3tts-0115)
- [https://github.com/QwenLM/Qwen3-TTS](https://github.com/QwenLM/Qwen3-TTS)
- [https://huggingface.co/collections/Qwen/qwen3-tts](https://huggingface.co/collections/Qwen/qwen3-tts)
- [https://modelscope.cn/collections/Qwen/Qwen3-TTS](https://modelscope.cn/collections/Qwen/Qwen3-TTS)

---

### [百川智能发布医疗大模型M3 Plus](https://mp.weixin.qq.com/s/tgowZrsp0IPCt1_vYgo0Aw) `#4`
> 百川智能发布医疗大模型M3 Plus，官方称幻觉率仅2.6%并首创证据锚定技术，向医疗机构免费开放API。

百川智能发布医疗大模型Baichuan-M3 Plus，采用六源循证技术将幻觉率降至2.6%，首创"证据锚定"可追溯原始论文。启动"海纳百川"计划向医疗机构免费提供API，调用成本降70%，限时15天免费体验。

相关链接：
- [https://mp.weixin.qq.com/s/tgowZrsp0IPCt1_vYgo0Aw](https://mp.weixin.qq.com/s/tgowZrsp0IPCt1_vYgo0Aw)

---

### [百度发布文心大模型5.0正式版](https://x.com/Baidu_Inc/status/2014252300018254054) `#5`
> 百度发布文心大模型5.0正式版，采用原生全模态架构，支持多模态输入输出，已在文心APP和官网上线，开发者可通过千帆平台调用。

百度发布文心大模型5.0正式版，参数规模达2.4万亿，采用MoE架构，单次推理激活参数低于3%。该模型为原生全模态大模型，基于统一自回归架构实现文本、图像、音频、视频等数据联合训练，区别于业界"后期融合"方案。功能上在多模态理解、代码生成等场景实现突破，可自动生成可运行代码。官方数据显示，在40余项权威基准评测中，其语言与多模态理解能力达国际第一梯队，图像与视频生成能力与垂直专精模型相当。目前已上线文心APP和文心一言官网，企业及开发者可通过百度AI Cloud千帆平台调用。

![](https://pbs.twimg.com/media/G_QK91HakAAVwHG?format=jpg&name=large)

![](https://pbs.twimg.com/media/G_QK_OibMAAOKk9?format=jpg&name=large)

相关链接：
- [https://x.com/Baidu_Inc/status/2014252300018254054](https://x.com/Baidu_Inc/status/2014252300018254054)
- [https://mp.weixin.qq.com/s/PCdqfn-dO5NRO3ZvEZMedQ](https://mp.weixin.qq.com/s/PCdqfn-dO5NRO3ZvEZMedQ)
- [https://ernie.baidu.com](https://ernie.baidu.com)

---

## 开发生态

### [Cua发布开源Computer-Use Agent 基础设施](https://github.com/trycua/cua) `#6`
> Cua 发布开源桌面 AI Agent 基础设施，支持 macOS、Linux、Windows。平台含 Cua、Cua-Bench 和 Lume，提供沙箱、SDK 与基准测试，采用 MIT 许可证，可通过 Python 快速接入。

Cua发布开源Computer-Use Agent基础设施，为控制macOS、Linux、Windows桌面的AI Agent提供训练、评估与部署工具。平台含三部分：Cua用于构建桌面交互Agent；Cua-Bench在OSWorld、ScreenSpot、Windows Arena等基准上评估模型或训练Agent；Lume在Apple Silicon以近原生性能运行macOS/Linux虚拟机。项目采用MIT许可证，提供cua-agent等核心包及Python SDK。

![](https://github.com/trycua/cua/raw/main/img/cua-architecture.png)

相关链接：
- [https://github.com/trycua/cua](https://github.com/trycua/cua)
- [https://cua.ai/](https://cua.ai/)

---

### [Gradium推出顶尖语音克隆技术](https://gradium.ai/blog/voice-cloning-sounds-fake) `#7`
> Gradium推出顶尖语音克隆技术，精准还原口音、韵律与身份。支持盲测验证，提供classifier-free guidance调节功能。API已开放，用户可立即接入使用。

Gradium发布语音克隆技术，官方称其可捕捉口音、韵律与身份，支持盲测试与可调classifier-free guidance，API已开放。

![](https://pbs.twimg.com/media/G_R9M-MXcAAH6Jw?format=jpg&name=orig)

相关链接：
- [https://gradium.ai/blog/voice-cloning-sounds-fake](https://gradium.ai/blog/voice-cloning-sounds-fake)

---

### [Anthropic发布Claude Code最佳实践指南](https://code.claude.com/docs/en/best-practices) `#8`
> Anthropic发布了Claude Code最佳实践指南，汇集了内部与外部工程师经验，旨在提升开发者与AI协作的编码效率。该指南系统介绍了如何与受限上下文的AI Agent高效交互，涵盖环境配置、会话管理及自动化扩展等关键模式。

Anthropic发布Claude Code最佳实践，整合内外工程师经验，指导开发者与自主性但受上下文限制的AI Agent高效协作，涵盖环境配置、会话管理至自动化扩展。

相关链接：
- [https://code.claude.com/docs/en/best-practices](https://code.claude.com/docs/en/best-practices)

---

### [腾讯云发布CodeBuddy  Code 2.0](https://mp.weixin.qq.com/s/mXziYWAqRTP-I7UxmKyRTg) `#9`
> 腾讯云发布 CodeBuddy Code 2.0，开放 SDK 与 API，支持 AI Agent 集成，采用 Plan 模式与 ACP 协议实现标准化编程。增强社区兼容性，支持插件市场、自定义智能体与 AgentHooks，迁移 CLI 生态。新增基于 TencentOS 的沙箱隔离环境，提升代码执行安全。优化工程记忆、交互模式与工具权限，支持 GLM-4.7、GPT5.2Codex 等模型。企业版上线，提供统一认证、研效度量与安全审计。

腾讯云发布 CodeBuddy 2.0，开放 SDK/API 集成 AI Agent，Plan 模式+ACP 协议实现透明化编程。新增 Plugin 市场、自定义 Subagents、AgentHooks、TencentOS 沙箱安全，优化工程记忆与交互，支持自定义模型。企业版提供统一身份认证、研效度量、安全审计。

相关链接：
- [https://mp.weixin.qq.com/s/mXziYWAqRTP-I7UxmKyRTg](https://mp.weixin.qq.com/s/mXziYWAqRTP-I7UxmKyRTg)

---

### [Cursor 2.4发布引入subagents功能](https://cursor.com/cn/changelog/2-4) `#10`
> Cursor 发布 2.4 版本，新增子代理功能，支持并行处理任务，提升效率并优化上下文使用。新版本集成 Google 图像生成能力，Agent 可主动提问澄清，并支持自定义配置。

Cursor 2.4新增subagents并行任务、Google Nano Banana Pro图像生成功能，Agent可主动提问澄清。

相关链接：
- [https://cursor.com/cn/changelog/2-4](https://cursor.com/cn/changelog/2-4)
- [https://x.com/cursor_ai/status/2014433672401977382](https://x.com/cursor_ai/status/2014433672401977382)

---

### [OpenAI发布Codex CLI 0.89.0版本更新](https://developers.openai.com/codex/changelog) `#11`
> OpenAI 发布 Codex CLI 0.89.0，新增权限管理与技能 UI，弃用自定义提示，推荐使用 Skills。此前 0.88.0 修复多处错误并升级 Rust 依赖，现支持多智能体与子智能体功能。

OpenAI发布Codex CLI 0.89.0，新增/permissions与/skill UI管理技能，改进slash-command选择逻辑，弃用自定义提示并建议改用Skills。0.88.0版本增加设备码认证fallback，修复内存泄漏、Azure端点错误、WSL TUI图像粘贴问题，升级Rust依赖。Codex支持multi-agent/subagents，可通过/experimental启用。

相关链接：
- [https://developers.openai.com/codex/changelog](https://developers.openai.com/codex/changelog)

---

### [JetBrains IDE集成OpenAI Codex](https://blog.jetbrains.com/ai/2026/01/codex-in-jetbrains-ides/) `#12`
> JetBrains 将 OpenAI Codex 集成至其主流 IDE，用户可在 v2025.3 及以上版本中通过 AI Agent 选择器启用。通过 JetBrains AI 订阅可限时免费使用 Codex，额度用尽即止，其他方式不享受优惠，后续使用将消耗 AI Credits。

JetBrains IDE v2025.3及以上版本原生集成OpenAI Codex，支持IntelliJ、PyCharm、WebStorm、Rider。开发者通过JetBrains AI Agent选择器，可使用JetBrains AI订阅、ChatGPT账户或OpenAI API密钥验证身份。推广期间，通过订阅使用Codex限时免费至额度用尽，该优惠不适用于ChatGPT账户或API密钥，其他AI功能正常消耗AI Credits。免费期后，Codex使用将消耗AI Credits，用户可通过JetBrains AI小组件跟踪使用情况。

![](https://blog.jetbrains.com/wp-content/uploads/2026/01/works-agent.png)

相关链接：
- [https://blog.jetbrains.com/ai/2026/01/codex-in-jetbrains-ides/](https://blog.jetbrains.com/ai/2026/01/codex-in-jetbrains-ides/)

---

## 技术与洞察

### [谷歌DeepMind 发文介绍 D4RT 4D重建模型](https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/) `#13`
> Google DeepMind 发布 D4RT，一种高效动态 4D 重建与跟踪模型，速度比以往提升 18 至 300 倍，支持实时应用。该技术可用于机器人导航、AR 设备和世界模型构建，提升 AI 对物理环境的理解能力。

Google DeepMind发布D4RT（Dynamic 4D Reconstruction and Tracking）统一AI模型，用于4D场景重建与跟踪。该模型将动态场景重建统一到高效框架中，速度较传统方法提升18-300倍，支持实时应用。其应用潜力涵盖三大领域：机器人技术中，为动态环境提供空间感知与安全导航能力；AR眼镜可实现设备端低延迟场景几何理解；世界模型方面，能有效分离相机运动、物体运动与静态几何，构建更接近物理现实的AI"世界模型"。

相关链接：
- [https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/](https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/)
- [https://d4rt-paper.github.io/](https://d4rt-paper.github.io/)

---

## 行业动态

### [OpenAI探索基于成果的盈利模式](https://x.com/sama/status/2014399391025574308) `#14`
> OpenAI 正探索新盈利模式，收入将与客户成果挂钩，如收取版税或授权费。CEO Sam Altman 表示，API 业务月增超10亿美元年收入。

OpenAI CFO Sarah Friar透露，公司正探索超越订阅费的多元化盈利模式，包括版税、基于成果的定价等。新模式将收入与客户可衡量的成功挂钩，例如从使用其工具成功开发的药物销售额中分成。与此同时，CEO Sam Altman称，公司API业务过去一个月新增超10亿美元年度经常性收入。

相关链接：
- [https://x.com/sama/status/2014399391025574308](https://x.com/sama/status/2014399391025574308)
- [https://propakistani.pk/2026/01/22/chatgpt-will-soon-take-a-cut-of-your-profits-to-make-money/](https://propakistani.pk/2026/01/22/chatgpt-will-soon-take-a-cut-of-your-profits-to-make-money/)

---

### [OpenAI正在寻求500亿美元新融资](https://www.bloomberg.com/news/articles/2026-01-21/openai-s-altman-meets-mideast-investors-for-50-billion-round) `#15`
> OpenAI CEO 山姆·奥尔特曼正接触中东投资者，拟融资至少500亿美元，用于AI芯片与数据中心建设，估值或达7500亿至8300亿美元。

据报道，OpenAI CEO Sam Altman正与中东顶级投资者洽谈新一轮融资，规模至少500亿美元，公司估值将达7500-8300亿美元，资金拟用于AI芯片研发和数据中心建设。

相关链接：
- [https://www.bloomberg.com/news/articles/2026-01-21/openai-s-altman-meets-mideast-investors-for-50-billion-round](https://www.bloomberg.com/news/articles/2026-01-21/openai-s-altman-meets-mideast-investors-for-50-billion-round)

---

### [vLLM转型Inferact获1.5亿美元融资](https://inferact.ai/) `#16`
> vLLM 创始团队成立新公司 Inferact，完成 1.5 亿美元种子轮融资，估值 8 亿美元，由 a16z 和 Lightspeed 领投。公司将继续支持 vLLM 开源项目，并打造下一代 AI 推理引擎。

vLLM创造者成立Inferact，完成1.5亿美元种子轮融资，估值8亿美元，由Andreessen Horowitz和Lightspeed共同领投。项目2023年起源于UC Berkeley Ion Stoica实验室，致力于将vLLM发展为全球AI推理引擎，持续投入开源社区并构建商业推理引擎。

相关链接：
- [https://inferact.ai/](https://inferact.ai/)
- [https://techcrunch.com/2026/01/21/sources-project-sglang-spins-out-as-radixark-with-400m-valuation-as-inference-market-explodes/](https://techcrunch.com/2026/01/21/sources-project-sglang-spins-out-as-radixark-with-400m-valuation-as-inference-market-explodes/)

---

### [DeepMind招聘经济学家研究AGI经济](https://x.com/ShaneLegg/status/2014345509675155639) `#17`
> Google DeepMind 联合创始人 Shane Legg 正在招聘一名高级经济学家，负责领导团队研究 AGI 时代的经济学问题。

DeepMind联合创始人Shane Legg招聘高级经济学家，研究AGI后经济学领域。

相关链接：
- [https://x.com/ShaneLegg/status/2014345509675155639](https://x.com/ShaneLegg/status/2014345509675155639)
- [https://job-boards.greenhouse.io/deepmind/jobs/7556396](https://job-boards.greenhouse.io/deepmind/jobs/7556396)

---

### [cURL因LLM垃圾报告取消赏金计划](https://curl.se/.well-known/security.txt) `#18`
> cURL 维护者取消漏洞赏金计划，因大量由 LLM 生成的低质量报告泛滥，部分来自学生为作业或简历美化。社区担忧滥用行为，OWASP 等组织也面临类似问题。

cURL维护者因LLM低质漏洞报告取消赏金计划以减少滥用。据社区讨论，OWASP等也面临学期初大量无法复现的报告，部分疑为学生作业或简历 embellishment。

相关链接：
- [https://curl.se/.well-known/security.txt](https://curl.se/.well-known/security.txt)
- [https://news.ycombinator.com/item?id=46717556](https://news.ycombinator.com/item?id=46717556)

---

**提示**：内容由AI辅助创作，可能存在**幻觉**和**错误**。