2026-05-07 · Markdown

AI 早报 2026-05-07

视频版哔哩哔哩YouTube

概览

要闻

产品应用

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻


要闻

Anthropic 与 SpaceX 合作新增 300MW 算力,放宽使用限制 #1

Anthropic宣布与SpaceX达成合作,获得Colossus 1数据中心全部超过300兆瓦的算力。基于此及近期其他算力交易,Anthropic即日上调使用限额:Claude Code 的五小时滚动速率限制翻倍,同时移除Pro与Max方案在高峰时段的限额缩减。API中Opus模型速率限制也得到大幅提升。值得注意的是,每周总体限额并未提升。

Anthropic近期宣布与SpaceX达成一项算力合作,该合作使其获得SpaceX旗下Colossus 1数据中心全部超过300兆瓦(逾22万张NVIDIA GPU)的算力,并计划于本月内部署上线。基于此项合作以及近期其他算力交易,该公司即日生效上调了Claude的使用限额:将Pro、Max、Team及按席位计费的Enterprise方案的Claude Code五小时滚动速率限制翻倍;取消Pro与Max方案的高峰时段限额缩减;大幅提升API中Opus系列模型的速率限制。根据官方及多方信息,Colossus 1原为xAI用于训练Grok的超级计算机,随着SpaceX此前对xAI的收购以及xAI将训练重心转移至Colossus 2,该设施得以整体租赁给Anthropic以支持Claude的运行。此外,双方均表示有兴趣合作开发数吉瓦级别的轨道AI算力。

相关链接:


产品应用

谷歌更新搜索中AI Mode与AI Overviews,优化链接展示与排序 #2

Google更新了搜索中的AI Mode与AI Overviews,带来五项功能:AI回答末尾提供延伸阅读建议、高亮展示用户订阅的新闻链接、引入社区观点预览、在正文旁直接嵌入相关链接,以及桌面端新增悬停链接预览。

近日,Google更新了Search中的AI Mode与AI Overviews,助用户发掘网站及原创内容。据官方博客,此次更新包含五项功能:一是在AI回答末尾提供延伸阅读建议;二是推出新闻订阅集成,高亮已订阅媒体链接,官方早期测试显示其点击率显著提升;三是引入社区观点预览,提取公开讨论引述并附上下文;四是于AI回答正文要点旁直接嵌入链接;五是桌面端新增悬停预览功能,显示目标网站信息。团队正运用query fan-out等技术持续优化链接展示与排序。

相关链接:


Manus 升级 Projects 功能,支持从任务中自动学习复用模式 #3

Manus为其Projects功能上线“从每个任务学习”能力,能自动识别任务中的可复用指令、文件与工作流,经用户审查批准后更新项目上下文。

Manus为Projects功能推出“从每个任务学习”新能力,允许Project在每次任务对话后自动识别可复用的指令、文件、术语或工作流模式,并在用户审查批准后更新项目上下文。用户可通过提示词手动触发审查,或将其嵌入重复性工作流的节奏中,经授权后方可生效的更新涵盖指令、文件及技能,旨在让Projects随时间推移愈发有用,减少每次任务重复设置的成本,使后续任务能基于团队已学到的共识启动。

相关链接:


模型发布

豆包 Doubao-Seed-2.0-lite 模型升级支持全模态 #4

字节火山宣布Doubao-Seed-2.0-lite完成重大升级,成为豆包首款全模态理解模型。该模型支持视、图、音、文统一理解与跨模态推理,Agent、Coding与GUI能力增强,可闭环执行界面操作。其视觉在物理、医疗推理上超越前代pro版,部分领域达SOTA;音频支持19语种转写互译。该模型已在火山方舟上线。此外,Doubao-Seed-2.0-mini同步上线,同样支持全模态。

字节跳动火山引擎宣布Doubao-Seed-2.0-lite模型完成重大版本升级,作为豆包大模型家族首款全模态理解模型,它已支持视频、图像、音频、文本的原生统一理解与跨模态联合推理,同时Agent、Coding与GUI能力获得全面增强。其视觉理解在物理及医疗等高阶学科推理上表现大幅超越前代版本Doubao-Seed-2.0-pro,并在细粒度感知与具身理解等关键领域达到SOTA水平;音频能力支持19个语种的精准语音转写与多语种互译,并能深度捕捉情绪、环境声等细节,在多项公开基准评测中优于Gemini-3.1-Pro。该模型现已在火山方舟平台上线。此外,能力同步升级的Doubao-Seed-2.0-mini也已上线,同样支持全模态理解且Tokens效率较上代更高。

相关链接:


Zyphra发布ZAYA1-8B,AMD平台训练开源 #5

Zyphra发布了总参数8.4B、活跃参数760M的MoE语言模型ZAYA1-8B。该模型完全在AMD集群上训练,在数学与编程推理任务上击败了部分大型模型。

Zyphra发布开源MoE模型ZAYA1-8B(760M活跃参数,8.4B总参数)。其完全在AMD MI300X集群端到端训练,专注数学与代码推理,引入CCA等创新架构及多阶段后训练。配合Markovian RSA测试时计算法,在额外高算力下其于APEX-shortlist超越DeepSeek-V3.2等大模型。模型已依Apache 2.0开源。

相关链接:


开发生态

Claude Managed Agents 上线 dreaming 与 outcomes 等功能 #6

Anthropic为Claude Managed Agents推出预览版dreaming与测试版outcomes等功能。其中,dreaming可自动优化记忆实现Agent自我改进,outcomes 可通过独立评分提升输出质量。

近日,Anthropic为Claude Managed Agents推出多项升级:发布研究预览版“dreaming”及公开测试版的“outcomes”、多Agent编排与webhooks。

dreaming可回顾历史提取模式优化记忆,实现跨会话自我改进。outcomes引入基于评分的自我校正机制,指导Agent迭代。多Agent编排支持将复杂任务拆分给子Agent并行处理。

相关链接:


Cursor 发布 3.3 版,新增上下文占用明细及 CI 自动修复 #7

Cursor发布3.3版本,开发者现在能直观查看上下文中 rules、skills等内容的占用明细来优化配置,还能设置常驻Agent自动对CI失败提交修复。

近日,Cursor在其IDE的3.3版本中为Agent新增了上下文占用细目查看功能,同时上线了CI失败自动修复能力。根据官方发布的信息,开发者可以直观查看Agent在rules、skills、MCPs及subagents等模块上的上下文占用明细,并利用这些统计数据诊断问题、优化配置;用户还可设置始终在线的Agent监控GitHub仓库,这些Agent能自动调查CI失败根因并提交包含修复的Pull Request。

相关链接:


TRAE 宣布三端同步全量免费开放 #8

TRAE 宣布 SOLO 三端同步全量开放。该产品支持通过移动端语音跨设备远程调度Agent任务,三端均可语音交互生成会议纪要,桌面端与网页端新增飞书接入与定时任务功能。

TRAE 正式宣布移动端,网页端与新增 Windows 版的桌面端同步全量开放,三端中国区均免费提供服务。该产品内置双模式智能体,移动端支持语音、文本及文件输入,可连接云端与多台 PC 实现跨设备远程任务调度,多端任务状态实时同步,单账号最多允许 10 台设备同时在线。此次更新中,三端均支持与 AI 语音交互并自动生成结构化会议纪要;桌面端与网页端新增飞书 CLI 接入能力及定时任务功能。用户可通过应用商店或官网获取体验。

相关链接:


OpenClaw 发布 2026.5.5 及 5.6,新增功能并修复问题 #9

OpenClaw项目发布2026.5.5和2026.5.6两版更新。5.5版修复了多平台频道与插件更新的稳定性问题。5.6版则紧急修正了系列Bug与报错。

OpenClaw近期发布2026.5.5与2026.5.6版本。据官方消息,2026.5.5版重点修复即时通讯频道、控制界面、插件更新及网关诊断的稳定性问题。随后紧急发布的2026.5.6版用于修复上个版本缺陷。

相关链接:


Warp 团队开源 oz-skills 集合,包含 15 个内部工作流技能 #10

Warp团队开源了包含15个组件的Agent Skills合集oz-skills,涵盖Git协作与Web审计等五大场景。开发者可通过执行npx指令快速安装。

近日,Warp团队正式将其内部用于加速工作流的Agent Skills集合“oz-skills”开源,项目已在GitHub发布并遵循MIT协议。该集合包含15个可复用Skills,覆盖Git/GitHub协作、数据分析、Web质量审计、基础设施工程规范及通用生产力五类场景。所有Skills均为包含YAML前置元数据的Markdown文件,遵循Agent Skills规范。

相关链接:


技术与洞察

Unsloth AI 联合 NVIDIA 优化,大模型训练速度提升约 25% #11

Unsloth AI与NVIDIA联合发布技术指南,通过引入“打包序列元数据缓存”、“双缓冲检查点重载”以及“MoE路由优化”三项技术,在B200显卡上将大语言模型训练速度提升约25%。

Unsloth AI近日与NVIDIA联合发布技术指南,通过三项关键优化将LLM训练速度提升约25%。这三项优化主要消除隐性开销中的重复工作与串行等待:一是打包序列元数据缓存,在Qwen3-14B任务中使批次整体提升14.3%;二是双缓冲检查点重载,使激活值拷贝与计算并行,在基于B200的8B至32B模型上带来4.6%至8.4%的吞吐提升;三是MoE路由优化,用一次性分组替代动态查询,实现10%至15%的整体提速。目前相关代码已在GitHub开源。

相关链接:


OpenAI 联合英伟达等开源 MRC 网络协议服务 AI 训练 #12

OpenAI联合AMD、英伟达等公司,通过开放计算项目正式开源了一种名为MRC的新型网络协议。这个协议专为大规模AI训练设计,能解决同步训练时GPU数据传输的拥塞和故障问题,目前已在Stargate等项目中部署。

OpenAI联合AMD、Broadcom、Intel、Microsoft及NVIDIA通过OCP正式开源新型网络协议MRC。该协议将数据包喷洒至多路径并结合SRv6源路由,将网络架构从3-4层交换机简化为2层。仅2层交换机即可连接约13.1万张GPU,降低了功耗与成本,并能微秒级绕过故障。MRC已部署于OpenAI所有最大GB200超算系统,用于训练前沿模型。官方指出,面对频繁链路抖动甚至重启4台核心交换机,MRC均未对训练任务产生可测量影响。

相关链接:


行业动态

Fenris Creations 宣布独立并联手 DeepMind 启动 AI Agent 研究 #13

运营EVE Online的CCP Games正式更名为Fenris Creations并与Google DeepMind达成合作。双方将把该游戏作为安全沙盒,在受控离线环境中探索AI Agent的记忆、持续学习与长期规划能力。

运营《EVE Online》的CCP Games宣布更名为Fenris Creations,结束与Pearl Abyss的八年隶属关系。此外,Fenris Creations与Google DeepMind达成研究合作,共同在EVE Online这一由复杂经济、政治与玩家冲突驱动的宇宙中探索Agent的记忆、持续学习与长期规划能力。官方称,初始研究将在受控离线版本中进行,不与游戏实时服务器Tranquility相连。Google DeepMind总监Alexandre Moufarek将EVE称为测试通用人工智能的“独一无二的安全沙盒”,并期待借此拓展AI前沿与玩家体验。更多细节将在即将举办的Fanfest 2026上披露。

相关链接:


谷歌 Flow Music 联手 Believe,向艺人开放 AI 音乐生成工具 #14

Google宣布Flow Music与Believe达成合作,向其旗下艺人提供AI音乐生成工具Flow Music,且谷歌不主张对生成内容拥有所有权。

近日,Google宣布旗下AI音乐工具Flow Music及底层模型Lyria 3 Pro与Believe达成合作,向Believe及TuneCore旗下艺人、制作人和词曲作者开放使用。Google明确声明,不主张对该工具生成的原创内容拥有所有权。此外,Believe和TuneCore将挑选部分艺人与制作人,每周与Google团队会面反馈,以促进该工具未来发展。

相关链接:


WorldClaw 联合特朗普家族 WLFI 平台推出 WorldRouter #15

近日,WorldClaw与特朗普家族创立的加密项目WLFI联合推出模型路由平台WorldRouter。用户凭单账户可调用超300款AI模型。目前,社区对该平台折扣真实性及相关机制存在诸多质疑。

WorldClaw近日与加密货币项目WLFI联合推出AI模型路由平台WorldRouter,用户通过单一账户即可调用300余款AI模型,费用据称比模型官方定价及OpenRouter低约30%。该平台后续还规划了WorldAgent运行时与预装操作系统的本地AI硬件。WLFI由特朗普的三个儿子等人创立,特朗普曾列为荣誉联合创始人,其家族可从销售中获得75%净收益。平台现已上线官网,但社区对其折扣真实性、代币锁仓机制与持久性存在诸多质疑。

相关链接:


前瞻与传闻

月之暗面传将获 20 亿美元融资,估值超 200 亿美元 #16

据报道,Kimi即将完成20亿美元新一轮融资,投后估值突破200亿美元,且该公司ARR已突破2亿美元。

据《晚点 LatePost》消息,Kimi(月之暗面)即将完成新一轮 20 亿美元融资,投后估值突破 200 亿美元。该轮融资由美团龙珠领投,中国移动、CPE(源峰资本)等参投,其中仅龙珠就出手超 2 亿美元。据美团龙珠合伙人王新宇透露,在K2.5模型更新后,Kimi ARR于今年3月突破1亿美元,并于4月增长至超2亿美元。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误