![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/imagehub/20260303/20260303091713415620bea8_cover_12ff.png)

# AI 早报 2026-03-03

**视频版**：[哔哩哔哩](https://www.bilibili.com/video/BV1AHA9zUEaV) ｜ [YouTube](https://www.youtube.com/watch?v=03lLL4yn6Fg)

## 概览
### 要闻
- 千问团队开源Qwen3.5小尺寸模型系列 [↗](https://mp.weixin.qq.com/s/n8TbEYzklxg4kKh6_dDVlg) `#1`
- 智谱 GLM Coding Plan 套餐开启退款通道 `#2`
### 产品应用
- 美团推出Tabbit浏览器并陷开源抄袭争议 [↗](https://mp.weixin.qq.com/s/C8Mdb34apUsv-coN2yGx1A) `#3`
- Anthropic向免费用户开放Claude记忆功能 [↗](https://x.com/claudeai/status/2028559427167834314) `#4`
- MiniMax推出移动端MaxClaw [↗](https://x.com/MiniMaxAgent/status/2028445211593208230) `#5`
- 千问发布AI眼镜AI硬件，售价低至1997元 [↗](https://www.ithome.com/0/924/929.htm) `#6`
### 模型发布
- 阶跃星辰开源Step 3.5 Flash模型及训练框架 [↗](https://github.com/stepfun-ai/SteptronOss) `#7`
- IQuestLab开源IQuest-Coder-V1系列代码模型权重 [↗](https://iquestlab.github.io/release-1.0-2603/index.html) `#8`
- 小红书开源FireRed-OCR模型 [↗](https://github.com/FireRedTeam/FireRed-OCR) `#9`
- 通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 [↗](https://mp.weixin.qq.com/s/sTNC7bVphs9zofly3lBoUQ) `#10`
- Jan团队发布 Jan-Code-4B 模型 [↗](https://huggingface.co/janhq/Jan-code-4b) `#11`
### 开发生态
- OpenClaw发布2026.3.1版本 [↗](https://github.com/openclaw/openclaw/releases/tag/v2026.3.1) `#12`
- agent-browse上线Electron技能 [↗](https://x.com/ctatedev/status/2028128730132922760) `#13`
- Anthropic推出免费AI课程 [↗](http://anthropic.skilljar.com) `#14`
- Kimi开放平台推出限时充值返券活动 [↗](https://mp.weixin.qq.com/s/aVF9bf8Wc44lwZY_zF0w5g) `#15`
### 技术与洞察
- 字节跳动联合清华发布CUDA Agent强化学习系统 [↗](https://cuda-agent.github.io/) `#16`
### 行业动态
- MiniMax发布2025财年全年业绩报告 [↗](https://minimaxi.com/news/minimax%E5%8F%91%E5%B8%83-2025-%E5%B9%B4%E5%85%A8%E5%B9%B4%E4%B8%9A%E7%BB%A9) `#17`
- 阿里巴巴统一AI品牌为千问 [↗](https://mp.weixin.qq.com/s/ZNt7WYcKoydV04Weu1p0qQ) `#18`
- 智谱Z.ai启动面向AI创业者的扶持计划 [↗](http://startup.z.ai) `#19`
### 前瞻与传闻
- 马斯克确认将于今日发布Grok 4.20 Beta 2 [↗](https://x.com/elonmusk/status/2028491891562660329) `#20`

---

## 要闻

### [千问团队开源Qwen3.5小尺寸模型系列](https://mp.weixin.qq.com/s/n8TbEYzklxg4kKh6_dDVlg) `#1`
> Qwen 团队正式发布了 Qwen 3.5 小模型系列，涵盖 0.8B、2B、4B 和 9B 四款模型，该系列模型在多项评测中创下同等尺寸性能新高。其中，0.8B 和 2B 模型体积小巧、速度快，适合边缘设备计算。4B 模型被定位为轻量级 Agent 的强力多模态底座。9B 模型则在紧凑体积下大幅缩小了与更大参数模型的能力差距。

千问团队正式开源Qwen3.5小尺寸模型系列，涵盖 0.8B、2B、4B 和 9B 四款模型，家族矩阵扩至8款。新模型基于原生多模态基座，融合Gated Delta Networks与稀疏MoE架构，原生支持262K上下文并可扩展至1M+。系列采用Apache 2.0协议，同步开源基座与对话模型。其中0.8B/2B主打端侧部署，默认非思考模式；4B定位轻量Agent；9B宣称具备越级性能。目前模型已登陆HF、魔搭及Ollama，官方数据显示其在多模态及Agent基准测试中表现优异。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/2b671820-01b6-4722-a9bd-ee2be822ef0b/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/2b671820-01b6-4722-a9bd-ee2be822ef0b/m002.png)

相关链接：
- [https://mp.weixin.qq.com/s/n8TbEYzklxg4kKh6_dDVlg](https://mp.weixin.qq.com/s/n8TbEYzklxg4kKh6_dDVlg)
- [https://huggingface.co/collections/Qwen/qwen35](https://huggingface.co/collections/Qwen/qwen35)

---

### 智谱 GLM Coding Plan 套餐开启退款通道 `#2`
> 智谱 GLM Coding Plan 套餐现已开启退款通道，2025年12月19日前购买的用户需手动提交工单办理。

据社区用户反馈，智谱GLM Coding Plan退款通道开启，2025年12月19日前购买需手动提交工单。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/b188d818-29db-41dd-8a71-0aa45e2509bb/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/b188d818-29db-41dd-8a71-0aa45e2509bb/m002.png)

---

## 产品应用

### [美团推出Tabbit浏览器并陷开源抄袭争议](https://mp.weixin.qq.com/s/C8Mdb34apUsv-coN2yGx1A) `#3`
> 美团旗下光年之外团队发布AI原生浏览器Tabbit并开启公测，该产品基于Chrome内核，用户可通过“全能输入框”调用Agent自主执行网页任务，国际版内置GPT-5.2、Claude-Sonnet-4.6等多款主流大模型。但产品发布即遭遇争议，被开发者指控违反GPL协议抄袭开源项目“陪读蛙”。

近日，美团旗下光年之外团队与北京酷讯联合发布AI原生浏览器Tabbit并开启公测。该产品基于Chrome内核，集成了智能代理模式与“全能输入框”，支持自主执行网页任务及无代码扩展，国际版内置GPT-5.2、Claude-Sonnet-4.6等多款主流大模型。与此同时，开源开发者mengxi-ream公开指控Tabbit涉嫌抄袭其开源项目“陪读蛙”，称其违反GPL协议使用代码但未开源，目前该事件已在社区引发关于开源合规性的热议。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/26b5f6c9-f4fb-49ef-a99e-f6a56cd6c682/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/26b5f6c9-f4fb-49ef-a99e-f6a56cd6c682/m002.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/26b5f6c9-f4fb-49ef-a99e-f6a56cd6c682/m003.png)

相关链接：
- [https://mp.weixin.qq.com/s/C8Mdb34apUsv-coN2yGx1A](https://mp.weixin.qq.com/s/C8Mdb34apUsv-coN2yGx1A)
- [https://tabbitbrowser.com](https://tabbitbrowser.com)
- [https://github.com/mengxi-ream/read-frog](https://github.com/mengxi-ream/read-frog)

---

### [Anthropic向免费用户开放Claude记忆功能](https://x.com/claudeai/status/2028559427167834314) `#4`
> Anthropic 正式向免费用户开放了 Claude 的记忆功能，同时支持用户导出记忆，或从其他 AI 聊天机器人导入记忆。

Anthropic 官方宣布，Claude 的 Memory 功能现已正式向免费计划用户开放。免费用户现可利用该功能记住用户偏好及历史交互，从而获得更个性化的体验。此次更新重点优化了数据迁移与便携性。官方表示，已简化将保存的 Memory 导入 Claude 的流程。此外，用户拥有完全的数据控制权，可随时导出已保存的内容，确保数据的跨平台可用性。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/075315ce-b2ec-4bd6-8da9-0b6ff2df93b4/m001.png)

相关链接：
- [https://x.com/claudeai/status/2028559427167834314](https://x.com/claudeai/status/2028559427167834314)

---

### [MiniMax推出移动端MaxClaw](https://x.com/MiniMaxAgent/status/2028445211593208230) `#5`
> MiniMax 移动端 App 正式上线 MaxClaw 功能，实现了与 Web 端的消息同步，用户可在手机端直接与 Agent 交互。

MiniMax 官方宣布移动端 App 上线 MaxClaw 功能，支持 Web 端消息同步，用户可直接与 Agent 交互，无需依赖即时通讯软件。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/567a1908-96e3-43d0-8d98-3c2c6bd96014/m001.png)

相关链接：
- [https://x.com/MiniMaxAgent/status/2028445211593208230](https://x.com/MiniMaxAgent/status/2028445211593208230)

---

### [千问发布AI眼镜AI硬件，售价低至1997元](https://www.ithome.com/0/924/929.htm) `#6`
> 千问首款AI眼镜开启预约，将于3月8日现货发售，G1系列叠加优惠后到手价低至1997元。该产品整机仅重40克，搭载最新千问大模型，支持3K视频录制、实时翻译及会议记录。

千问正式发布首款 AI 硬件“千问 AI 眼镜”，首发 S1 与 G1 系列。产品现已开启全渠道“0 元预约”，定于 3 月 8 日在中国现货发售，计划年内登陆全球市场。其中 G1 系列标价 2899 元，叠加优惠后低至 1997 元。

该眼镜搭载最新千问大模型，整机重约 40g，支持换电及“手机级”影像技术，具备 3K 视频录制与 AI 4K 输出能力。功能上支持多模态交互、翻译及会议记录。此外，产品将接入千问 App，首批“办事”功能预计 3 月底开放，并计划适配 Spotify、PayPal 等国际生态。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/aeb16b96-a76d-4925-b738-275fe9715552/m001.png)

相关链接：
- [https://www.ithome.com/0/924/929.htm](https://www.ithome.com/0/924/929.htm)
- [https://www.aibase.com/zh/news/25825](https://www.aibase.com/zh/news/25825)

---

## 模型发布

### [阶跃星辰开源Step 3.5 Flash模型及训练框架](https://github.com/stepfun-ai/SteptronOss) `#7`
> 阶跃星辰正式开源 Step 3.5 Flash 基础及中间训练版模型，同步公开了仅需 PyTorch 依赖的 SteptronOSS 训练框架，两者均遵循 Apache 2.0 协议。

阶跃星辰StepFun宣布开源Step 3.5 Flash模型基础版与中间训练版，同步公开训练代码库SteptronOSS。该模型采用稀疏MoE架构，总参数196B，激活11B，支持256K上下文。引入多Token预测技术，生成吞吐量峰值达350 tok/s。官方数据显示，其在SWE-bench Verified和Terminal-Bench 2.0上分别达74.4%和51.0%。SteptronOSS框架支持SFT、RLVR及评估，仅需PyTorch运行。模型权重已上线Hugging Face，采用Apache 2.0协议，SFT数据集后续发布。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/9a1ca130-1088-4573-90c3-f01a9e9bcfad/m001.png)

相关链接：
- [https://github.com/stepfun-ai/SteptronOss](https://github.com/stepfun-ai/SteptronOss)
- [https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base](https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base)
- [https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base-Midtrain](https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base-Midtrain)

---

### [IQuestLab开源IQuest-Coder-V1系列代码模型权重](https://iquestlab.github.io/release-1.0-2603/index.html) `#8`
> IQuestLab 已正式在 Hugging Face 上开源 IQuest-Coder-V1 全系列模型权重，涵盖 7B 至 40B 的Thinking 等多个版本。

IQuestLab 正式开源并上传 IQuest-Coder-V1 系列模型权重至 Hugging Face，涵盖 7B、14B（Base、Instruct、Thinking 变体）及 40B Thinking、40B-Loop-Thinking 实验变体，面向自主软件工程与代码智能领域。

该系列模型采用浅层架构设计，据官方说明，其在 7B 和 14B 规模下可实现 3-5 倍的推理加速。训练方面，模型应用 Code-Flow 训练范式，从代码仓库的演化模式、Commit 迁移中学习。在后训练阶段，通过分叉式策略衍生出专精模型：Thinking 版本基于推理驱动的强化学习解决复杂编程问题；Instruct 版本侧重通用代码协作。作为实验性原型，40B-Loop-Thinking 采用循环 Transformer 设计，旨在探索嵌套式推理机制。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/31dc4846-deaa-4c5d-b920-98e744301475/m001.png)

相关链接：
- [https://iquestlab.github.io/release-1.0-2603/index.html](https://iquestlab.github.io/release-1.0-2603/index.html)
- [https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Thinking](https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Thinking)
- [https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Thinking](https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Thinking)
- [https://huggingface.co/IQuestLab/IQuest-Coder-V1-14B-Instruct](https://huggingface.co/IQuestLab/IQuest-Coder-V1-14B-Instruct)
- [https://huggingface.co/IQuestLab/IQuest-Coder-V1-7B-Instruct](https://huggingface.co/IQuestLab/IQuest-Coder-V1-7B-Instruct)

---

### [小红书开源FireRed-OCR模型](https://github.com/FireRedTeam/FireRed-OCR) `#9`
> 小红书 REDtech 团队开源了 FireRed-OCR 模型，该模型基于 Qwen3-VL-2B 架构，在文本识别、公式解析及表格重构等关键指标上全面领先。

小红书 REDtech 团队近日宣布开源基于 Qwen3-VL-2B 架构的智能文档处理模型 FireRed-OCR，旨在解决视觉语言模型在复杂文档处理中的“结构性幻觉”问题。该模型首创“三阶段渐进优化”策略与“几何+语义”数据工厂，显著提升了结构化解析能力。

官方数据显示，在 OmniDocBench v1.5 评测中，FireRed-OCR 以 92.94% 的综合准确率刷新纪录，成为首个突破 92% 阈值的端到端模型。其在文本识别、公式解析、表格重构及阅读顺序等细分指标上均表现优异。目前，该模型已在 GitHub、Hugging Face 及 ModelScope 等平台全面开源。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/5f2ab929-7f59-4333-ab1e-571291dbc3ee/m001.png)

相关链接：
- [https://github.com/FireRedTeam/FireRed-OCR](https://github.com/FireRedTeam/FireRed-OCR)
- [https://huggingface.co/FireRedTeam/FireRed-OCR](https://huggingface.co/FireRedTeam/FireRed-OCR)

---

### [通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型](https://mp.weixin.qq.com/s/sTNC7bVphs9zofly3lBoUQ) `#10`
> 阿里通义实验室发布了 Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型。前者专注多语种复刻与精细化控制，后者定位全场景声音设计，支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前，两款模型均已开放 API 调用。

阿里通义实验室发布Fun-CosyVoice3.5与Fun-AudioGen-VD两款语音模型，支持FreeStyle指令生成。Fun-CosyVoice3.5专注多语种复刻与精细化控制，引入DiffRO与GRPO技术，使生僻字读错率从15.2%降至5.3%，首包延迟降低35%，新增泰语等四个语种。Fun-AudioGen-VD定位全场景声音设计，支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前两模型均已提供API调用。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/4a157d8a-0cdb-49e3-8003-999a284e746e/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/4a157d8a-0cdb-49e3-8003-999a284e746e/m002.png)

相关链接：
- [https://mp.weixin.qq.com/s/sTNC7bVphs9zofly3lBoUQ](https://mp.weixin.qq.com/s/sTNC7bVphs9zofly3lBoUQ)

---

### [Jan团队发布 Jan-Code-4B 模型](https://huggingface.co/janhq/Jan-code-4b) `#11`
> Jan团队发布了基于Qwen3架构的40亿参数代码模型Jan-Code-4B，该模型主打本地低延迟运行。

Jan团队近日发布40亿参数代码调优模型Jan-Code-4B，底层架构源自Qwen3-4B-Instruct-2507。该模型专为本地低延迟迭代设计，旨在作为轻量级编程助手或Agent工作流中的快速Worker，替代Claude Code设置中的Haiku模型。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/15a286ca-b452-4f37-ac2c-607930ab9311/m001.png)

相关链接：
- [https://huggingface.co/janhq/Jan-code-4b](https://huggingface.co/janhq/Jan-code-4b)

---

## 开发生态

### [OpenClaw发布2026.3.1版本](https://github.com/openclaw/openclaw/releases/tag/v2026.3.1) `#12`
> OpenClaw 发布 2026.3.1 版本。此次更新重点引入了 OpenAI WebSocket 与 Claude 4.6 自适应思考，显著改善了容器化部署支持，并推出了 Agent 驱动的可视化差异插件。同时，其 GitHub Star 数已超过 React。

OpenClaw 正式发布 2026.3.1 版本，新版本引入 OpenAI WebSocket streaming，支持 Claude 4.6 adaptive thinking，并显著优化了 Docker 及 Native K8s 体验。生态集成上，新增 Discord threads 支持，修复 Feishu 相关问题，并推出 Agent 驱动的 visual diffs plugin。此外，其 GitHub Star 数已超越 React。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/ed317041-03db-4692-b366-bd6a388a814d/m001.png)

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/ed317041-03db-4692-b366-bd6a388a814d/m002.png)

相关链接：
- [https://github.com/openclaw/openclaw/releases/tag/v2026.3.1](https://github.com/openclaw/openclaw/releases/tag/v2026.3.1)
- [https://x.com/openclaw/status/2028340185902006404](https://x.com/openclaw/status/2028340185902006404)

---

### [agent-browse上线Electron技能](https://x.com/ctatedev/status/2028128730132922760) `#13`
> agent-browser 上线了 Electron 新技能，允许 Agent 绕过视觉识别，通过直接读取 HTML 来控制 Discord、Figma 及 VS Code 等桌面应用。开发者现可通过一条 npx 命令将该技能集成至任意编程 Agent 中，即刻实现桌面应用的自动化控制与调试。

agent-browser 发布了 Electron 新技能，允许 Agent 直接控制 Discord、Figma、Notion、Spotify 及 VS Code 等桌面应用。该功能不依赖视觉识别，而是将 Electron 应用视为浏览器，通过读取渲染的 HTML 进行交互，适用于自动化控制及应用调试。开发者可通过 `npx skills add vercel-labs/agent-browser --skill electron` 命令集成该技能。此外，agent-browser 也支持通过相应命令控制 Slack 客户端。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/658b60dc-601a-4e76-abe6-502e02e701a2/m001.png)

相关链接：
- [https://x.com/ctatedev/status/2028128730132922760](https://x.com/ctatedev/status/2028128730132922760)
- [https://github.com/vercel-labs/agent-browser](https://github.com/vercel-labs/agent-browser)

---

### [Anthropic推出免费AI课程](http://anthropic.skilljar.com) `#14`
> Anthropic 上线了一套完全免费且无需注册的 AI 课程，内容涵盖 Claude Code 实战、Agent Skill 构建等前沿技术。

Anthropic近日上线一套免费AI课程，无需账号即可通过官网访问并获取证书。课程核心涵盖Claude Code实战、Claude API构建及模型上下文协议（MCP）全栈开发，包含Agent Skill构建与Amazon Bedrock、Google Vertex AI云平台整合内容。此外，该系列还提供基础AI流利度培训，并专为教育工作者、学生及非营利组织提供定制化课程，旨在帮助不同群体高效、安全地将AI能力融入工作与教学。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/bb78f408-5e2b-4d8a-9aa8-94a7cfda226f/m001.png)

相关链接：
- [http://anthropic.skilljar.com](http://anthropic.skilljar.com)

---

### [Kimi开放平台推出限时充值返券活动](https://mp.weixin.qq.com/s/aVF9bf8Wc44lwZY_zF0w5g) `#15`
> Kimi 开放平台即日起至 3 月 8 日推出限时充值活动，最高可获赠 40% 代金券。

Kimi开放平台宣布即日起至3月8日推出限时充值活动，用户充值达到不同档位数额可获赠对应20%至40%代金券，券于次日发放且有效期90天。活动重点推广Kimi K2.5多模态模型，得益于Mooncake架构，该模型缓存命中率约90%，使API实际输入价格仅为原定价的25%。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/7a9bca04-8096-4bb3-8ea5-fbc5250ecce0/m001.png)

相关链接：
- [https://mp.weixin.qq.com/s/aVF9bf8Wc44lwZY_zF0w5g](https://mp.weixin.qq.com/s/aVF9bf8Wc44lwZY_zF0w5g)

---

## 技术与洞察

### [字节跳动联合清华发布CUDA Agent强化学习系统](https://cuda-agent.github.io/) `#16`
> ByteDance Seed 联合清华大学智能产业研究院推出了名为“CUDA Agent”的大规模强化学习系统，旨在通过真实硬件数据反馈自动生成高性能的 CUDA Kernel。

ByteDance Seed 联合清华大学 AIR 及 SIA-Lab 发布“CUDA Agent”项目及论文。该系统系大规模 Agentic RL 架构，通过利用真实 GPU Profiling 数据作为奖励信号，生成高性能 CUDA Kernel。项目构建了三阶段数据流水线，产出了含 6000 样本的 CUDA-Agent-Ops-6K 数据集，并采用 ReAct 工作流及分阶段训练策略。官方 KernelBench 数据显示，CUDA Agent 几何平均加速比为 2.11 倍；在 Level-1 和 Level-2 任务中相比 `torch.compile` 达 100% 加速率，Level-3 任务中达 90%。其表现击败 Claude Opus 4.5 等闭源模型约 40 个百分点。目前代码库与数据集已分别在 GitHub 和 Hugging Face 上线。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/b62e55f2-ef4e-4abd-aed5-1b9437fb7cbb/m001.png)

相关链接：
- [https://cuda-agent.github.io/](https://cuda-agent.github.io/)
- [https://github.com/BytedTsinghua-SIA/CUDA-Agent](https://github.com/BytedTsinghua-SIA/CUDA-Agent)

---

## 行业动态

### [MiniMax发布2025财年全年业绩报告](https://minimaxi.com/news/minimax%E5%8F%91%E5%B8%83-2025-%E5%B9%B4%E5%85%A8%E5%B9%B4%E4%B8%9A%E7%BB%A9) `#17`
> MiniMax发布2025财年业绩，总营收7903.8万美元，同比增长158.9%，其中海外市场贡献约73%。期内毛利率提升至25.4%，经调整净亏损为2.509亿美元，亏损率收窄，现金储备10.5亿美元。

MiniMax（00100.HK）发布上市后首份年报，2025年总收入7903.8万美元，同比增长158.9%，超70%收入源自国际市场。公司毛利增至2010万美元，毛利率提升至25.4%，经调整净亏损2.509亿美元，亏损率同比显著收窄。官方称已完成全模态布局，累计服务用户超2.36亿，最新发布的M2.5模型编程效率提升37%且成本大幅降低。CEO闫俊杰透露截至2026年2月公司ARR已超1.5亿美元，Notion已集成其模型。未来MiniMax将向AI平台型公司迈进。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/416d3d50-27fe-4e6c-b3c9-3d385c792ad0/m001.png)

相关链接：
- [https://minimaxi.com/news/minimax%E5%8F%91%E5%B8%83-2025-%E5%B9%B4%E5%85%A8%E5%B9%B4%E4%B8%9A%E7%BB%A9](https://minimaxi.com/news/minimax%E5%8F%91%E5%B8%83-2025-%E5%B9%B4%E5%85%A8%E5%B9%B4%E4%B8%9A%E7%BB%A9)

---

### [阿里巴巴统一AI品牌为千问](https://mp.weixin.qq.com/s/ZNt7WYcKoydV04Weu1p0qQ) `#18`
> 阿里巴巴宣布将大模型B端品牌和C端应用品牌统一为千问。统一名称之后，阿里巴巴大模型品牌中文为“千问大模型”，英文为“Qwen”。“通义千问”的名称将不再使用。

阿里巴巴近日宣布将旗下AI业务品牌矩阵全面统一更名为“千问”（Qwen），此举标志着其AI战略进入新阶段。据官方公告，原“通义千问”系列更名为“千问大模型”，C端旗舰应用更名为“千问 APP”，而“通义实验室”将继续作为AI研发机构专注技术突破。

品牌重塑紧随其后强劲的技术表现。阿里巴巴于除夕开源了Qwen 3.5系列模型，官方显示该系列多款模型包揽了Hugging Face全球开源大模型榜单前四名，已成为全球开发者社区活跃度最高的开源模型之一。

市场应用层面，千问APP表现突出。官方数据显示，其在春节期间处理了近2亿次“一句话下单”指令。根据第三方机构QuestMobile统计，该应用日活跃用户达到7352万，增幅高达940%，位居国内AI类应用前列，显示出强大的用户粘性与市场吸引力。

此外，有行业分析认为，阿里巴巴此次统一品牌旨在通过品牌降维与认知聚合，强化其在开源生态与C端市场的领导地位。随着Qwen 3.5体系的完善，这种从技术领先向品牌生态化的转型，或将重塑国内大模型行业的竞争格局。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/0c30baed-0dda-452e-898a-f3f5fad29428/m001.png)

相关链接：
- [https://mp.weixin.qq.com/s/ZNt7WYcKoydV04Weu1p0qQ](https://mp.weixin.qq.com/s/ZNt7WYcKoydV04Weu1p0qQ)

---

### [智谱Z.ai启动面向AI创业者的扶持计划](http://startup.z.ai) `#19`
> 智谱 Z.ai 宣布 Startup Program 正式开放申请，入选团队将获得 Free API credits、Priority rate limits 以及 Early API Access 等核心权益。

智谱Z.ai 宣布 Startup Program 现已开放申请，旨在支持 AI-native 初创企业、Agent 构建者、集成 LLM infra 的 SaaS 创始人及构建现实世界规模应用的全球团队。入选团队将获得 Free API credits、Priority rate limits、Exclusive Community 访问权以及 Early API Access 等权益。官方建议正在构建重要产品的团队立即通过 startup.z.ai 提交申请，如有疑问可联系 @ZaiforStartups。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/1150ec37-2503-4921-bcbb-9ab5a5685ff6/m001.png)

相关链接：
- [http://startup.z.ai](http://startup.z.ai)

---

## 前瞻与传闻

### [马斯克确认将于今日发布Grok 4.20 Beta 2](https://x.com/elonmusk/status/2028491891562660329) `#20`
> xAI 首席执行官 Elon Musk 确认 Grok 4.20 Beta 2 将于今日发布，并将同步公开详细的版本说明。

xAI 首席执行官 Elon Musk 确认，Grok 4.20 Beta 2 将于今日发布，并同步公开详细版本说明。此次更新回应了社区对模型迭代的期待，用户重点关注代码能力提升及不同规格模型的发布计划。另据非官方反馈，巴西地区 Grok 服务疑似中断；部分 SuperGrok Heavy 订阅用户在 Grok Build 抢先体验网站提交邮箱时遭遇 HTTP 405 错误，导致无法获取优先访问权限。

![](http://testtttt.oss-cn-guangzhou.aliyuncs.com/uploads/aidaily/12ff61fa-fc76-495d-941c-b43569d8cd9f/f6b0b027-6943-47cb-bdc3-5f61db6dbb80/m001.png)

相关链接：
- [https://x.com/elonmusk/status/2028491891562660329](https://x.com/elonmusk/status/2028491891562660329)

---

**提示**：内容由AI辅助创作，可能存在**幻觉**和**错误**。