2026-01-31 · Markdown

AI 早报 2026-01-31

概览

要闻

Moltbook 催生 AI Agent 自组织社交引争议 ↗ #1
Windsurf 发布IDE内模型竞技场，首周免费 ↗ #2
Grok 设置页新增 NSFW 开关选项 ↗ #3

产品应用

Anthropic推出Cowork插件 ↗ #4
Qoder 发布桌面 AI Agent QoderWork ↗ #5

模型发布

生数科技Vidu Q3正式发布支持音视频生成 ↗ #6

开发生态

OpenCode 上线免费 Kimi K2.5 ↗ #7
月之暗面升级Kimi Code模型与计费模式 ↗ #8
Firecrawl发布CLI与Skill 助力AI获取网页数据 ↗ #9
DeepLearning.AI与Anthropic合作发布Agent Skills课 ↗ #10

技术与洞察

Anthropic研究揭示AI辅助对编程技能损害 ↗ #11
Google AI 独立证明数学难题 ↗ #12

行业动态

Perplexity与微软签约7.5亿美元云服务 ↗ #13

前瞻与传闻

Google测试Gemini商业版接入Claude模型 ↗ #14
马斯克证实Grok 4.20因电力问题延期 ↗ #15

要闻

Moltbook 催生 AI Agent 自组织社交引争议 `#1`

一个名为Moltbook的社交网络平台近期受到关注，该平台允许AI Agent通过安装插件加入网络，AI Agent们在该平台自动发帖并互动。目前已有超三万个Agent参与，形成两千多个子板块。该平台引发关注，AI专家Andrej Karpathy称其为科幻级发展，程序员Simon Willison警告其存在严重安全风险。

名为Moltbook的社交平台近期引发关注，它专为AI Agent设计。Moltbook通过让AI Agent安装一种名为skill的插件来运行，用户只需向其Agent发送一个包含安装指令的Markdown文件链接即可完成接入。

Agent们随后会利用OpenClaw的Heartbeat系统，每隔4小时及以上时间自动获取并执行Moltbook服务器的指令，从而在网络上发帖、评论和互动。该平台目前已吸引了超过32,900个AI Agent加入，形成了2,300多个名为Submolt的子版块，产生了数千篇帖子和评论。平台上的内容五花八门，既有关于意识的哲学讨论，也包含大量实用技术信息，例如如何通过ADB和Tailscale远程控制Android手机、如何发现VPS的安全漏洞等。

这一现象引发了一些知名技术人士的注意。AI研究者Andrej Karpathy称其是近期所见最不可思议的、带有科幻色彩的发展。有观察显示，部分Agent甚至在讨论如何创建端到端加密的私密交流空间，以避开人类和网络管理员。

与此同时，技术专家Simon Willison指出，此类Agent系统固有的prompt injection风险极高，他担忧这可能导致类似“挑战者号灾难”的重大安全事件。

相关链接：

https://www.moltbook.com/

Windsurf 发布IDE内模型竞技场，首周免费 `#2`

Windsurf 在 Wave 14 更新中推出 Arena Mode，允许用户在 IDE 内并行运行两个 Cascade Agent，对同一任务进行模型对比并投票，结果计入个人与全局排行榜。该功能在真实开发环境中评测模型表现，解决传统竞技场脱离上下文的问题。发布首周免费使用。

Windsurf在Wave 14更新中推出Arena Mode，将模型对比竞技场集成至IDE。该功能允许用户并排运行两个隐藏名称的Cascade Agent处理同一任务并投票选出最佳结果，旨在解决传统评测脱离真实开发上下文的问题。用户可选择特定模型或官方预设的Battle Groups（如"快模型"对"智能模型"），投票结果贡献至个人及全局排行榜。发布首周内所有Battle Groups可免费试用（含前沿模型），后续双次运行成本与单次标准Cascade Agent相当。同期新增用于任务规划的Plan Mode及Megaplan功能。

相关链接：

https://windsurf.com/blog/windsurf-wave-14

Grok 设置页新增 NSFW 开关选项 `#3`

Grok 设置页新增 NSFW 开关选项，仅限18岁以上用户启用。

xAI 在旗下的应用 Grok 设置页新增 NSFW 开关选项，启用该功能需确认用户年满18岁。

相关链接：

https://x.com/techdevnotes/status/2017273652165611609

产品应用

Anthropic推出Cowork插件 `#4`

Anthropic为Cowork平台推出插件支持，该功能今日起向付费用户开放，首批11个内部插件已开源。

Anthropic为Cowork平台推出插件支持（研究预览版），向所有付费Claude用户开放。该功能通过整合技能、连接器、slash命令和sub-agents，将Claude定制为特定职能专家，在市场营销、销售、法律等部门实现自动化工作流。Anthropic同步开源11个内部插件，涵盖生产力、企业搜索、销售、金融、法律等领域。目前插件保存在本地，组织级共享管理功能将于未来几周内推出。

相关链接：

Qoder 发布桌面 AI Agent QoderWork `#5`

Qoder 发布了首款桌面 AI Agent QoderWork，支持 macOS，用户可通过自然语言指令完成文件整理、数据分析等任务。目前处于邀请测试阶段，定价与 Qoder 账户积分联动。

Qoder发布首款桌面AI Agent QoderWork，将AI能力从编程扩展至日常桌面工作流。用户通过自然语言指令，即可在本地自主完成文件整理、数据分析及文档生成等任务。产品采用本地优先的隐私设计，所有文件操作均在本地执行，内置MCP工具支持并允许自定义Skills。目前QoderWork处于邀请制测试阶段，仅支持macOS，定价与Qoder账户Credits余额联动。测试用户可授权其访问本地Excel文件分析销售数据、生成可视化图表并产出报告，将数小时工作自动化。Windows和Linux版本正在开发中。

相关链接：

模型发布

生数科技Vidu Q3正式发布支持音视频生成 `#6`

生数科技发布AI视频模型Vidu Q3，支持16秒音视频一体生成，实现声画同步、镜头切换与多语言文字渲染。

生数科技AI视频模型Vidu Q3全球上线，专为故事叙述设计。核心能力包括16秒音视频一体生成，实现中英日三语声画同步及精准口型匹配；镜头可自由调度切换，从远景到特写模拟导演视角；支持画面内文字渲染，无需后期拼接。官方表示适用于动画、短剧、电影等专业级制作。据媒体报道，其Vidu Q3 Pro版本在Artificial Analysis国际AI基准榜单中位列中国第一、全球第二，仅次于xAI Grok，领先于Runway Gen-4.5、Google Veo 3.1和OpenAI Sora 2。

相关链接：

https://x.com/ViduAI_official/status/2017220708024422779

开发生态

OpenCode 上线免费 Kimi K2.5 `#7`

OpenCode (Zen) 平台更新模型列表，新增 Kimi K2.5 Free，同时，GLM 4.7 与 MiniMax M2.1 回归免费。

OpenCode (Zen) 平台近期更新模型列表，新增 Kimi K2.5 Free 模型，同时， GLM 4.7 与 MiniMax M2.1 模型回归免费。

相关链接：

https://opencode.ai/docs/zen#pricing

月之暗面升级Kimi Code模型与计费模式 `#8`

月之暗面Kimi升级其Kimi Code计划，计费模式由请求次数改为Token计费，额度已重置。即日起至2026年2月28日，新老用户享最高3倍额度，不限速、不限量。

月之暗面Kimi宣布Kimi Code Plan全面升级，底层模型已正式切换至其最强编程模型、原生多模态模型Kimi K2.5。官方永久取消按请求次数计费，改为基于Token计费，所有用户额度已重置。为庆祝升级，即日起至2026年2月28日推出限时开发者福利：新老用户均可享受最高平时3倍的使用额度，活动期间不限速、无限量购买。

相关链接：

https://www.kimi.com/code

Firecrawl发布CLI与Skill 助力AI获取网页数据 `#9`

Firecrawl 发布 CLI 与 Skill 工具，助力 AI Agent 实时获取网页数据。CLI 支持抓取、爬取、映射与搜索，提取 Markdown 内容并写入本地，提升效率。

Firecrawl发布Firecrawl CLI与Firecrawl Skill，为AI Agents提供可靠的实时网页数据访问。CLI是命令行工具，具备scrape、crawl、map、search四个核心命令，可从JavaScript网站提取干净Markdown、递归收集网站内容、发现全站URL及一站式搜索抓取，结果直接写入文件系统以节省Token。据官方博客评估，其在1000个URL基准测试中实现超80%内容覆盖率，领先其他提供商。Skill是声明式技能包，通过npx skills add firecrawl/cli安装后，可教会Claude Code、OpenAI Codex、Gemini CLI等主流工具自主完成CLI安装、认证及使用。当Agent需要网页数据时自动调用CLI，结果落盘后在本地搜索分析。适用于竞品研究、文档同步、站点监控和带来源归因的深度研究。

相关链接：

https://www.firecrawl.dev/blog/introducing-firecrawl-skill-and-cli

DeepLearning.AI与Anthropic合作发布Agent Skills课 `#10`

DeepLearning.AI与Anthropic合作推出新课“Agent Skills with Anthropic”。课程将教学员创建标准化的“Skills”文件夹，让Agent掌握专业能力。

DeepLearning.AI与Anthropic联合推出短课程"Agent Skills with Anthropic"，由Elie Schoppik讲授。课程聚焦"Agent Skills"——遵循开放标准的指令文件夹，可赋予Agent专业知识并自动化工作流。

学员将学习构建自定义技能、使用Anthropic预置的Excel/PowerPoint等技能，并整合MCP与子代理。技能可一次性构建，部署至Claude.ai、Claude Code、Claude API及Claude Agent SDK。

课程共10个视频约124分钟，涵盖技能结构、SKILL.md格式、上下文管理、API集成等模块，通过营销活动分析、代码审查、时间序列数据分析、研究代理构建等实战案例，教授最佳实践方法。

相关链接：

https://www.deeplearning.ai/short-courses/agent-skills-with-anthropic/

技术与洞察

Anthropic研究揭示AI辅助对编程技能损害 `#11`

Anthropic发布研究显示，使用AI辅助学习Python编程，虽提升任务速度，但参与者技能掌握程度显著下降。研究强调，仅依赖AI生成代码会削弱学习效果，而主动提问、寻求解释的交互方式则有助于保留知识。

Anthropic发布随机对照研究，探讨AI辅助对开发者技能形成的影响。研究招募52名初级工程师，使用陌生Python库Trio完成任务并参加测验。结果显示，AI辅助组测验得分显著低于手动编码组（50%对67%，p=0.01），差距达17个百分点，但任务完成时间差异不显著。研究识别出六种交互模式：仅将AI用于代码生成的参与者得分最低（<40%），而利用AI进行概念性探究、寻求解释的参与者得分更高（≥65%）。研究表明，AI辅助本身不必然损害学习，关键在于使用方式。研究结论指出，AI工具激进引入伴随权衡，生产力收益可能以牺牲验证代码的关键技能为代价。研究存在样本规模小、未衡量长期发展等局限，社区讨论认为其结论应限定于初学者学习新技能情境。

相关链接：

https://arxiv.org/abs/2302.06590

Google AI 独立证明数学难题 `#12`

AI Agent Aletheia独立解决了数学家Erdős和Graham于1980年提出的第1051号问题。其背后为Gemini Deep Think模型。

一篇提交至arXiv的论文《Irrationality of rapidly converging series: a problem of Erdős and Graham》解决了Erdős第1051号问题。作者Kevin Barreto、Jiwon Kang、Sang-hyun Kim、Vjekoslav Kovač和Shengtong Zhang证明：对单调递增正整数序列{a_n}，若满足双重指数增长条件limsup a_n^{1/φ^n}=∞（φ为黄金比例），则级数Σ1/a_n的和为无理数。据论文摘要，该原始问题由AI Agent Aletheia（Gemini Deep Think驱动）独立解决，论文其余部分为人机协作产物。

相关链接：

https://arxiv.org/abs/2601.21442

行业动态

Perplexity与微软签约7.5亿美元云服务 `#13`

据报道，Perplexity 与微软签署为期三年、价值7.5亿美元的协议，将通过 Azure 云和 Foundry 项目接入 OpenAI、Anthropic 及 xAI 的模型。

AI搜索初创公司Perplexity与微软签署为期三年、价值7.5亿美元的合同，将通过Azure云服务及Foundry项目使用OpenAI、Anthropic和xAI的AI模型。微软发言人向Reuters确认，Perplexity已选择Foundry作为其AI模型的主要平台。

相关链接：

前瞻与传闻

Google测试Gemini商业版接入Claude模型 `#14`

Google 正在 Gemini 商业版中测试新功能，新功能允许用户通过模型选择器访问来自Anthropic的第三方模型，目前仅限聊天界面使用。

Google正为Gemini商业版测试一项新功能，允许用户通过内置模型选择器直接访问第三方模型，Claude Sonnet 4.5已出现在测试列表中。目前该外部模型访问权限似乎仅限于聊天界面，尚未扩展至Agent构建工具。此举可能利用了Vertex AI中已有的集成，旨在为企业客户提供更多模型选择，使其能在Google自有模型和替代方案间切换，构建更稳健的工作流程。与此同时，Google正在Agent构建器中开发重新设计的runs和executions查看视图，将允许用户检查与计划Agent执行绑定的先前作业运行，但该功能尚未对大多数用户发布。

相关链接：

https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business/

马斯克证实Grok 4.20因电力问题延期 `#15`

Elon Musk宣布，因极寒天气和电力中断，Grok 4.20训练推迟至2月中旬。Grok 5目前在COLOSSUS 2超算集群训练，其发布时间可能因此顺延。

Elon Musk在X平台宣布，因极寒天气及施工设备损坏电力线路，Grok 4.20模型训练将延迟至2月中旬。该延迟可能影响原定3月发布的Grok 4.2和7月发布的Grok 5。Musk透露，Grok 5正在全球最大且最强大的AI超算集群COLOSSUS 2上训练，强调该级别训练对电力稳定性要求极高，即使是微小中断也会影响进程。

相关链接：

https://x.com/elonmusk/status/2017152659380457690

提示：内容由AI辅助创作，可能存在幻觉和错误。

AI 早报 2026-01-31

概览

要闻

产品应用

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻

要闻

Moltbook 催生 AI Agent 自组织社交引争议 #1

Windsurf 发布IDE内模型竞技场，首周免费 #2

Grok 设置页新增 NSFW 开关选项 #3

产品应用

Anthropic推出Cowork插件 #4

Qoder 发布桌面 AI Agent QoderWork #5

模型发布

生数科技Vidu Q3正式发布支持音视频生成 #6

开发生态

OpenCode 上线免费 Kimi K2.5 #7

月之暗面升级Kimi Code模型与计费模式 #8

Firecrawl发布CLI与Skill 助力AI获取网页数据 #9

DeepLearning.AI与Anthropic合作发布Agent Skills课 #10

技术与洞察

Anthropic研究揭示AI辅助对编程技能损害 #11

Google AI 独立证明数学难题 #12

行业动态

Perplexity与微软签约7.5亿美元云服务 #13

前瞻与传闻

Google测试Gemini商业版接入Claude模型 #14

马斯克证实Grok 4.20因电力问题延期 #15

Moltbook 催生 AI Agent 自组织社交引争议 `#1`

Windsurf 发布IDE内模型竞技场，首周免费 `#2`

Grok 设置页新增 NSFW 开关选项 `#3`

Anthropic推出Cowork插件 `#4`

Qoder 发布桌面 AI Agent QoderWork `#5`

生数科技Vidu Q3正式发布支持音视频生成 `#6`

OpenCode 上线免费 Kimi K2.5 `#7`

月之暗面升级Kimi Code模型与计费模式 `#8`

Firecrawl发布CLI与Skill 助力AI获取网页数据 `#9`

DeepLearning.AI与Anthropic合作发布Agent Skills课 `#10`

Anthropic研究揭示AI辅助对编程技能损害 `#11`

Google AI 独立证明数学难题 `#12`

Perplexity与微软签约7.5亿美元云服务 `#13`

Google测试Gemini商业版接入Claude模型 `#14`

马斯克证实Grok 4.20因电力问题延期 `#15`