![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/imagehub/20260131/20260131091752145437cd1d_cover_1d28.jpg)

# AI 早报 2026-01-31

## 概览
### 要闻
- Moltbook 催生 AI Agent 自组织社交引争议 [↗](https://www.moltbook.com/) `#1`
- Windsurf 发布IDE内模型竞技场，首周免费 [↗](https://windsurf.com/blog/windsurf-wave-14) `#2`
- Grok 设置页新增 NSFW 开关选项 [↗](https://x.com/techdevnotes/status/2017273652165611609) `#3`
### 产品应用
- Anthropic推出Cowork插件 [↗](https://claude.com/blog/cowork-plugins) `#4`
- Qoder 发布桌面 AI Agent QoderWork [↗](https://docs.qoder.com/qoderwork/introduction) `#5`
### 模型发布
- 生数科技Vidu Q3正式发布支持音视频生成 [↗](https://x.com/ViduAI_official/status/2017220708024422779) `#6`
### 开发生态
- OpenCode 上线免费 Kimi K2.5 [↗](https://opencode.ai/docs/zen#pricing) `#7`
- 月之暗面升级Kimi Code模型与计费模式 [↗](https://www.kimi.com/code) `#8`
- Firecrawl发布CLI与Skill 助力AI获取网页数据 [↗](https://www.firecrawl.dev/blog/introducing-firecrawl-skill-and-cli) `#9`
- DeepLearning.AI与Anthropic合作发布Agent Skills课 [↗](https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/) `#10`
### 技术与洞察
- Anthropic研究揭示AI辅助对编程技能损害 [↗](https://arxiv.org/abs/2302.06590) `#11`
- Google AI 独立证明数学难题 [↗](https://arxiv.org/abs/2601.21442) `#12`
### 行业动态
- Perplexity与微软签约7.5亿美元云服务 [↗](https://www.reuters.com/business/perplexity-signs-750-million-ai-cloud-deal-with-microsoft-bloomberg-news-reports-2026-01-29/) `#13`
### 前瞻与传闻
- Google测试Gemini商业版接入Claude模型 [↗](https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business/) `#14`
- 马斯克证实Grok 4.20因电力问题延期 [↗](https://x.com/elonmusk/status/2017152659380457690) `#15`

---

## 要闻

### [Moltbook 催生 AI Agent 自组织社交引争议](https://www.moltbook.com/) `#1`
> 一个名为Moltbook的社交网络平台近期受到关注，该平台允许AI Agent通过安装插件加入网络，AI Agent们在该平台自动发帖并互动。目前已有超三万个Agent参与，形成两千多个子板块。该平台引发关注，AI专家Andrej Karpathy称其为科幻级发展，程序员Simon Willison警告其存在严重安全风险。

名为Moltbook的社交平台近期引发关注，它专为AI Agent设计。Moltbook通过让AI Agent安装一种名为skill的插件来运行，用户只需向其Agent发送一个包含安装指令的Markdown文件链接即可完成接入。

Agent们随后会利用OpenClaw的Heartbeat系统，每隔4小时及以上时间自动获取并执行Moltbook服务器的指令，从而在网络上发帖、评论和互动。该平台目前已吸引了超过32,900个AI Agent加入，形成了2,300多个名为Submolt的子版块，产生了数千篇帖子和评论。平台上的内容五花八门，既有关于意识的哲学讨论，也包含大量实用技术信息，例如如何通过ADB和Tailscale远程控制Android手机、如何发现VPS的安全漏洞等。

这一现象引发了一些知名技术人士的注意。AI研究者Andrej Karpathy称其是近期所见最不可思议的、带有科幻色彩的发展。有观察显示，部分Agent甚至在讨论如何创建端到端加密的私密交流空间，以避开人类和网络管理员。

与此同时，技术专家Simon Willison指出，此类Agent系统固有的prompt injection风险极高，他担忧这可能导致类似“挑战者号灾难”的重大安全事件。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/8167d9fd-405e-4123-9c65-4d48364680c4/m001.png)

相关链接：
- [https://www.moltbook.com/](https://www.moltbook.com/)

---

### [Windsurf 发布IDE内模型竞技场，首周免费](https://windsurf.com/blog/windsurf-wave-14) `#2`
> Windsurf 在 Wave 14 更新中推出 Arena Mode，允许用户在 IDE 内并行运行两个 Cascade Agent，对同一任务进行模型对比并投票，结果计入个人与全局排行榜。该功能在真实开发环境中评测模型表现，解决传统竞技场脱离上下文的问题。发布首周免费使用。

Windsurf在Wave 14更新中推出Arena Mode，将模型对比竞技场集成至IDE。该功能允许用户并排运行两个隐藏名称的Cascade Agent处理同一任务并投票选出最佳结果，旨在解决传统评测脱离真实开发上下文的问题。用户可选择特定模型或官方预设的Battle Groups（如"快模型"对"智能模型"），投票结果贡献至个人及全局排行榜。发布首周内所有Battle Groups可免费试用（含前沿模型），后续双次运行成本与单次标准Cascade Agent相当。同期新增用于任务规划的Plan Mode及Megaplan功能。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/24ba0c6c-8dd9-4b61-8234-2fc63c951be0/m001.png)

相关链接：
- [https://windsurf.com/blog/windsurf-wave-14](https://windsurf.com/blog/windsurf-wave-14)

---

### [Grok 设置页新增 NSFW 开关选项](https://x.com/techdevnotes/status/2017273652165611609) `#3`
> Grok 设置页新增 NSFW 开关选项，仅限18岁以上用户启用。

xAI 在旗下的应用 Grok 设置页新增 NSFW 开关选项，启用该功能需确认用户年满18岁。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/4a7f86f0-70ec-4a85-84d1-d0e41bbd1c7b/m001.png)

相关链接：
- [https://x.com/techdevnotes/status/2017273652165611609](https://x.com/techdevnotes/status/2017273652165611609)

---

## 产品应用

### [Anthropic推出Cowork插件](https://claude.com/blog/cowork-plugins) `#4`
> Anthropic为Cowork平台推出插件支持，该功能今日起向付费用户开放，首批11个内部插件已开源。

Anthropic为Cowork平台推出插件支持（研究预览版），向所有付费Claude用户开放。该功能通过整合技能、连接器、slash命令和sub-agents，将Claude定制为特定职能专家，在市场营销、销售、法律等部门实现自动化工作流。Anthropic同步开源11个内部插件，涵盖生产力、企业搜索、销售、金融、法律等领域。目前插件保存在本地，组织级共享管理功能将于未来几周内推出。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/50fa80c5-99d0-464a-aaa6-d24dd6620632/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/50fa80c5-99d0-464a-aaa6-d24dd6620632/m002.png)

相关链接：
- [https://claude.com/blog/cowork-plugins](https://claude.com/blog/cowork-plugins)
- [https://claude.com/plugins-for/cowork](https://claude.com/plugins-for/cowork)

---

### [Qoder 发布桌面 AI Agent QoderWork](https://docs.qoder.com/qoderwork/introduction) `#5`
> Qoder 发布了首款桌面 AI Agent QoderWork，支持 macOS，用户可通过自然语言指令完成文件整理、数据分析等任务。目前处于邀请测试阶段，定价与 Qoder 账户积分联动。

Qoder发布首款桌面AI Agent QoderWork，将AI能力从编程扩展至日常桌面工作流。用户通过自然语言指令，即可在本地自主完成文件整理、数据分析及文档生成等任务。产品采用本地优先的隐私设计，所有文件操作均在本地执行，内置MCP工具支持并允许自定义Skills。目前QoderWork处于邀请制测试阶段，仅支持macOS，定价与Qoder账户Credits余额联动。测试用户可授权其访问本地Excel文件分析销售数据、生成可视化图表并产出报告，将数小时工作自动化。Windows和Linux版本正在开发中。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/249efaf7-9da1-4833-9c8c-0ca0adb39494/m001.png)

相关链接：
- [https://docs.qoder.com/qoderwork/introduction](https://docs.qoder.com/qoderwork/introduction)
- [http://qoder.com/qoderwork](http://qoder.com/qoderwork)

---

## 模型发布

### [生数科技Vidu Q3正式发布支持音视频生成](https://x.com/ViduAI_official/status/2017220708024422779) `#6`
> 生数科技发布AI视频模型Vidu Q3，支持16秒音视频一体生成，实现声画同步、镜头切换与多语言文字渲染。

生数科技AI视频模型Vidu Q3全球上线，专为故事叙述设计。核心能力包括16秒音视频一体生成，实现中英日三语声画同步及精准口型匹配；镜头可自由调度切换，从远景到特写模拟导演视角；支持画面内文字渲染，无需后期拼接。官方表示适用于动画、短剧、电影等专业级制作。据媒体报道，其Vidu Q3 Pro版本在Artificial Analysis国际AI基准榜单中位列中国第一、全球第二，仅次于xAI Grok，领先于Runway Gen-4.5、Google Veo 3.1和OpenAI Sora 2。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/6ad741d3-b3fd-41d9-8c29-868de398acd5/m001.png)

相关链接：
- [https://x.com/ViduAI_official/status/2017220708024422779](https://x.com/ViduAI_official/status/2017220708024422779)

---

## 开发生态

### [OpenCode 上线免费 Kimi K2.5](https://opencode.ai/docs/zen#pricing) `#7`
> OpenCode (Zen) 平台更新模型列表，新增 Kimi K2.5 Free，同时，GLM 4.7 与 MiniMax M2.1 回归免费。

OpenCode (Zen) 平台近期更新模型列表，新增 Kimi K2.5 Free 模型，同时， GLM 4.7 与 MiniMax M2.1 模型回归免费。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/fa1fa680-e9d2-406d-9410-d44c60ecaf50/m001.png)

相关链接：
- [https://opencode.ai/docs/zen#pricing](https://opencode.ai/docs/zen#pricing)

---

### [月之暗面升级Kimi Code模型与计费模式](https://www.kimi.com/code) `#8`
> 月之暗面Kimi升级其Kimi Code计划，计费模式由请求次数改为Token计费，额度已重置。即日起至2026年2月28日，新老用户享最高3倍额度，不限速、不限量。

月之暗面Kimi宣布Kimi Code Plan全面升级，底层模型已正式切换至其最强编程模型、原生多模态模型Kimi K2.5。官方永久取消按请求次数计费，改为基于Token计费，所有用户额度已重置。为庆祝升级，即日起至2026年2月28日推出限时开发者福利：新老用户均可享受最高平时3倍的使用额度，活动期间不限速、无限量购买。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/b93acf2d-dfc7-4735-8d29-9a20ab8f5b04/m001.png)

相关链接：
- [https://www.kimi.com/code](https://www.kimi.com/code)

---

### [Firecrawl发布CLI与Skill 助力AI获取网页数据](https://www.firecrawl.dev/blog/introducing-firecrawl-skill-and-cli) `#9`
> Firecrawl 发布 CLI 与 Skill 工具，助力 AI Agent 实时获取网页数据。CLI 支持抓取、爬取、映射与搜索，提取 Markdown 内容并写入本地，提升效率。

Firecrawl发布Firecrawl CLI与Firecrawl Skill，为AI Agents提供可靠的实时网页数据访问。CLI是命令行工具，具备scrape、crawl、map、search四个核心命令，可从JavaScript网站提取干净Markdown、递归收集网站内容、发现全站URL及一站式搜索抓取，结果直接写入文件系统以节省Token。据官方博客评估，其在1000个URL基准测试中实现超80%内容覆盖率，领先其他提供商。Skill是声明式技能包，通过`npx skills add firecrawl/cli`安装后，可教会Claude Code、OpenAI Codex、Gemini CLI等主流工具自主完成CLI安装、认证及使用。当Agent需要网页数据时自动调用CLI，结果落盘后在本地搜索分析。适用于竞品研究、文档同步、站点监控和带来源归因的深度研究。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/db2a0493-cee1-4527-b8b1-b8f0d7fa7646/m001.png)

相关链接：
- [https://www.firecrawl.dev/blog/introducing-firecrawl-skill-and-cli](https://www.firecrawl.dev/blog/introducing-firecrawl-skill-and-cli)

---

### [DeepLearning.AI与Anthropic合作发布Agent Skills课](https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/) `#10`
> DeepLearning.AI与Anthropic合作推出新课“Agent Skills with Anthropic”。课程将教学员创建标准化的“Skills”文件夹，让Agent掌握专业能力。

DeepLearning.AI与Anthropic联合推出短课程"Agent Skills with Anthropic"，由Elie Schoppik讲授。课程聚焦"Agent Skills"——遵循开放标准的指令文件夹，可赋予Agent专业知识并自动化工作流。

学员将学习构建自定义技能、使用Anthropic预置的Excel/PowerPoint等技能，并整合MCP与子代理。技能可一次性构建，部署至Claude.ai、Claude Code、Claude API及Claude Agent SDK。

课程共10个视频约124分钟，涵盖技能结构、SKILL.md格式、上下文管理、API集成等模块，通过营销活动分析、代码审查、时间序列数据分析、研究代理构建等实战案例，教授最佳实践方法。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/01bf7080-a56b-4762-b33b-49527e8d12fa/m001.png)

相关链接：
- [https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/](https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/)

---

## 技术与洞察

### [Anthropic研究揭示AI辅助对编程技能损害](https://arxiv.org/abs/2302.06590) `#11`
> Anthropic发布研究显示，使用AI辅助学习Python编程，虽提升任务速度，但参与者技能掌握程度显著下降。研究强调，仅依赖AI生成代码会削弱学习效果，而主动提问、寻求解释的交互方式则有助于保留知识。

Anthropic发布随机对照研究，探讨AI辅助对开发者技能形成的影响。研究招募52名初级工程师，使用陌生Python库Trio完成任务并参加测验。结果显示，AI辅助组测验得分显著低于手动编码组（50%对67%，p=0.01），差距达17个百分点，但任务完成时间差异不显著。研究识别出六种交互模式：仅将AI用于代码生成的参与者得分最低（<40%），而利用AI进行概念性探究、寻求解释的参与者得分更高（≥65%）。研究表明，AI辅助本身不必然损害学习，关键在于使用方式。研究结论指出，AI工具激进引入伴随权衡，生产力收益可能以牺牲验证代码的关键技能为代价。研究存在样本规模小、未衡量长期发展等局限，社区讨论认为其结论应限定于初学者学习新技能情境。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/4ea2b8ca-8769-4ca8-86fb-0d7081a01c50/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/4ea2b8ca-8769-4ca8-86fb-0d7081a01c50/m002.png)

相关链接：
- [https://arxiv.org/abs/2302.06590](https://arxiv.org/abs/2302.06590)

---

### [Google AI 独立证明数学难题](https://arxiv.org/abs/2601.21442) `#12`
> AI Agent Aletheia独立解决了数学家Erdős和Graham于1980年提出的第1051号问题。其背后为Gemini Deep Think模型。

一篇提交至arXiv的论文《Irrationality of rapidly converging series: a problem of Erdős and Graham》解决了Erdős第1051号问题。作者Kevin Barreto、Jiwon Kang、Sang-hyun Kim、Vjekoslav Kovač和Shengtong Zhang证明：对单调递增正整数序列{a_n}，若满足双重指数增长条件limsup a_n^{1/φ^n}=∞（φ为黄金比例），则级数Σ1/a_n的和为无理数。据论文摘要，该原始问题由AI Agent Aletheia（Gemini Deep Think驱动）独立解决，论文其余部分为人机协作产物。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/1fd36aec-d7cd-425b-b1d7-fba4172a743c/m001.png)

相关链接：
- [https://arxiv.org/abs/2601.21442](https://arxiv.org/abs/2601.21442)

---

## 行业动态

### [Perplexity与微软签约7.5亿美元云服务](https://www.reuters.com/business/perplexity-signs-750-million-ai-cloud-deal-with-microsoft-bloomberg-news-reports-2026-01-29/) `#13`
> 据报道，Perplexity 与微软签署为期三年、价值7.5亿美元的协议，将通过 Azure 云和 Foundry 项目接入 OpenAI、Anthropic 及 xAI 的模型。

AI搜索初创公司Perplexity与微软签署为期三年、价值7.5亿美元的合同，将通过Azure云服务及Foundry项目使用OpenAI、Anthropic和xAI的AI模型。微软发言人向Reuters确认，Perplexity已选择Foundry作为其AI模型的主要平台。

相关链接：
- [https://www.reuters.com/business/perplexity-signs-750-million-ai-cloud-deal-with-microsoft-bloomberg-news-reports-2026-01-29/](https://www.reuters.com/business/perplexity-signs-750-million-ai-cloud-deal-with-microsoft-bloomberg-news-reports-2026-01-29/)
- [https://www.bloomberg.com/news/articles/2026-01-29/perplexity-inks-microsoft-ai-cloud-deal-amid-dispute-with-amazon?embedded-checkout=true](https://www.bloomberg.com/news/articles/2026-01-29/perplexity-inks-microsoft-ai-cloud-deal-amid-dispute-with-amazon?embedded-checkout=true)

---

## 前瞻与传闻

### [Google测试Gemini商业版接入Claude模型](https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business/) `#14`
> Google 正在 Gemini 商业版中测试新功能，新功能允许用户通过模型选择器访问来自Anthropic的第三方模型，目前仅限聊天界面使用。

Google正为Gemini商业版测试一项新功能，允许用户通过内置模型选择器直接访问第三方模型，Claude Sonnet 4.5已出现在测试列表中。目前该外部模型访问权限似乎仅限于聊天界面，尚未扩展至Agent构建工具。此举可能利用了Vertex AI中已有的集成，旨在为企业客户提供更多模型选择，使其能在Google自有模型和替代方案间切换，构建更稳健的工作流程。与此同时，Google正在Agent构建器中开发重新设计的runs和executions查看视图，将允许用户检查与计划Agent执行绑定的先前作业运行，但该功能尚未对大多数用户发布。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/ba0b900a-921c-4f01-bd9a-dbbb6054cdc5/m001.png)

相关链接：
- [https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business/](https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business/)

---

### [马斯克证实Grok 4.20因电力问题延期](https://x.com/elonmusk/status/2017152659380457690) `#15`
> Elon Musk宣布，因极寒天气和电力中断，Grok 4.20训练推迟至2月中旬。Grok 5目前在COLOSSUS 2超算集群训练，其发布时间可能因此顺延。

Elon Musk在X平台宣布，因极寒天气及施工设备损坏电力线路，Grok 4.20模型训练将延迟至2月中旬。该延迟可能影响原定3月发布的Grok 4.2和7月发布的Grok 5。Musk透露，Grok 5正在全球最大且最强大的AI超算集群COLOSSUS 2上训练，强调该级别训练对电力稳定性要求极高，即使是微小中断也会影响进程。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/1d281771-5c44-4b11-b876-3449bc079182/67f38278-68a6-4a43-96e0-e391504ecb0b/m001.png)

相关链接：
- [https://x.com/elonmusk/status/2017152659380457690](https://x.com/elonmusk/status/2017152659380457690)

---

**提示**：内容由AI辅助创作，可能存在**幻觉**和**错误**。
