2026-02-17 · Markdown

AI 早报 2026-02-17

概览

要闻

产品应用

模型发布

行业动态

前瞻与传闻


要闻

蚂蚁百灵发布Ling-2.5-1T模型 #1

蚂蚁集团开源了 Ling-2.5-1T 模型,激活参数为 630 亿,在数学与工具调用等任务中表现优异。该模型采用混合线性注意力架构,支持最长 100 万 token 上下文。

蚂蚁集团的团队发布并开源了 Ling-2.5-1T 模型。作为 Ling 家族最新的旗舰级即时模型,Ling-2.5-1T 在模型架构、token 效率及偏好对齐等方面进行了升级。该模型拥有 1T 总参数,其中激活参数为 63B,预训练语料规模从前代的 20T 扩展至 29T tokens。通过引入高效的混合线性注意力架构,Ling-2.5-1T 能够以高吞吐量处理最长 1M token 的上下文。该模型采用 MIT 许可证开源,已在 Hugging Face 和 ModelScope 上提供下载。Chat 体验页面和 API 服务将在 Ling studio 和 ZenMux 平台上线。

相关链接:


产品应用

Manus 推出 Manus Agents #2

Manus 推出 Manus Agents,用户可通过特定聊天应用直接使用个人 Agent,无需代码或复杂配置。所有订阅用户可立即使用,未来将扩展更多平台。

Manus官方宣布推出Manus Agents,支持用户在消息应用中直接使用功能完整的个人Agent。该功能已向所有订阅层级的用户开放,目前已可在特定聊天应用使用,未来将拓展至更多平台。此Agent并非轻量级附加功能,而是具备完整推理、工具使用及多步骤任务执行能力的Manus本体,核心网页功能在聊天环境中同样受支持。

相关链接:


Kilo 上线优化版 Grok Code Fast 1 #3

Kilo 宣布上线优化版 Grok Code Fast 1 模型,限时免费开放。该模型通过测试时计算扩展技术,动态调整算力,提升了整体性能。

Kilo.ai 宣布上线优化版 Grok Code Fast 1 模型,现限时免费向用户开放。此举旨在接替 xAI 已转入付费的原版模型。新模型引入测试时计算扩展技术,能根据请求需求动态调整算力,平衡响应速度与推理深度。官方表示,该版本不仅针对开发者关注的关键基准测试进行了调优,更专门校准了包含多文件逻辑的复杂现实编码任务。用户现已可在 Kilo 生态系统内(包括 Cloud Agents、Code Reviewer、Kilo for Slack 及新推出的 Kilo CLI)直接选用该模型。

相关链接:


模型发布

Qwen正式发布原生多模态模型Qwen3.5 #4

Qwen团队发布首款开放权重模型Qwen3.5-397B-A17B,总参数3970亿,激活170亿,支持多模态与Agent能力。采用混合架构,兼容Hugging Face、ModelScope等平台,API服务通过阿里云百炼提供,支持1M上下文。

Qwen团队正式发布Qwen3.5系列首款开放权重模型Qwen3.5-397B-A17B。这是一款原生视觉-语言模型,总参数量3970亿,每次前向传播仅激活170亿参数,采用Gated Delta Networks线性注意力与稀疏混合专家(MoE)的混合架构,实现性能与效率的平衡。

技术架构 该模型旨在将VL、Coder、QwQ等专才能力合并为一体,专为真实世界Agent训练设计。核心创新在于高效混合架构:512个专家中每次激活10个路由专家和1个共享专家。模型原生支持262,144 tokens上下文长度,通过RoPE扩展可支持至1,010,000 tokens,兼容Hugging Face Transformers、vLLM、SGLang等框架。

性能表现 官方评测显示,该模型在MMLU-Pro得87.8分,IFEval得92.6分;通用Agent任务中BFCL-V4得72.9分,TAU2-Bench得86.7分;视觉理解方面MathVision得88.6分,VideoMME(带字幕)得87.5分,OSWorld-Verified得62.2分。性能提升主要得益于对RL任务和环境的大规模扩展。

训练效率 基于Qwen3-Next架构,在32k/256k上下文下解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍。多语言覆盖从119种扩展至201种,25万词表为多数语言带来10–60%编解码效率提升。基础设施层面,异构训练实现近100%纯文本基线吞吐,激活显存降低约50%;异步强化学习框架实现3×–5×端到端加速,可扩展至百万级Agent环境。

使用方式 用户可通过Qwen Chat体验自动、思考与快速三种模式;阿里云百炼提供API服务版本Qwen3.5-Plus,默认支持1M上下文,集成搜索与Code Interpreter能力。开源权重已发布于Hugging Face和ModelScope。据林俊阳透露,未来几天将发布更多小型模型。官方表示下一阶段重点将从模型规模转向系统整合,构建具备持久记忆、真实世界交互接口及自我改进机制的伙伴型智能体。

相关链接:


行业动态

智谱启动合伙人计划应对GLM-5算力瓶颈 #5

智谱宣布启动“算力合伙人”计划,面向芯片厂商、算力伙伴及推理服务商,共建高并发、低延迟推理网络,应对GLM-5全球需求激增导致的排队与延迟问题。

智谱启动“算力合伙人”招募计划,以应对GLM-5因全球需求激增导致的排队、响应延迟与卡顿。此前,智谱虽多次扩容国产芯片集群并限量发售套餐,但供需问题仍未完全解决。该计划面向芯片厂商,将开放核心技术接口,联合开展针对GLM-5的底层软硬一体化优化,旨在打造性能标杆。同时,计划也面向算力伙伴与推理服务商,共建更高并发、更低延迟的推理网络,并寻求其他形式的算力合作。合作意向可通过邮箱 procurement@aminer.cn 进行沟通。

相关链接:


Flapping Airplanes获1.8亿融资 #6

AI实验室 Flapping Airplanes 获得 1.8 亿美元种子轮融资。该团队核心聚焦于 AI “数据效率” 问题,探索受人类大脑启发且适配硅基硬件的新算法。

据报道,新锐 AI 研究实验室 Flapping Airplanes 宣布完成 1.8 亿美元种子轮融资。该公司由 Ben Spector、Asher Spector 兄弟与曾任职于 Neuralink 的 Aidan Smith 共同创立,其核心使命是解决 AI 模型的“数据效率”问题。团队认为,当前依赖海量数据训练的主流范式与人类凭极少量数据就能高效学习之间存在巨大鸿沟。因此,他们致力于探索受人类大脑启发、但为硅基硬件优化的全新算法架构,旨在构建在数据受限环境中仍能高效学习的系统。

相关链接:


Ricursive Intelligence宣布完成3.35亿美元融资 #7

AI芯片设计公司Ricursive Intelligence成立四个月即完成3.35亿美元融资,公司专注于用AI自动化芯片设计流程,目标是实现AI与硬件协同进化。

由前 Google Brain 及 Anthropic 员工 Anna Goldie 和 Azalia Mirhoseini 联合创立的 Ricursive Intelligence,在成立四个月内完成 3.35 亿美元融资。此次包括 Lightspeed 领投、估值 40 亿美元的 3 亿美元 A 轮,及 Sequoia 领投的 3500 万美元种子轮。

Ricursive 不制造芯片,而是基于 Alpha Chip 项目开发 AI 自动化设计工具,结合 LLM 与强化学习将芯片布局时间从数年缩短至数小时。Nvidia 既是投资者也是目标客户。创始人称,该技术旨在加速模型与硬件协同进化,有望提升特定模型性能效率近 10 倍以推动 AGI 发展。

相关链接:


前瞻与传闻

传 Kimi K3 计划于 3 月发布 #8

根据社交媒体上流传的信息,Kimi K3 计划于 2026 年 3 月发布,采用 MLA 与 KDA 混合架构,并集成超稀疏 MoE 技术,参数量将超过 2T。

根据社交媒体上流传的信息,Kimi K3 计划于 2026 年 3 月发布。该模型将采用 MLA 与 KDA 的混合架构,并集成参数总量超过 2T 的超稀疏 MoE 技术。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误