2026-02-02 · Markdown

AI 早报 2026-02-02

概览

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻


模型发布

阿里 Qoder 发布 Qwen-Coder-Qoder #1

Qoder 发布了专为自身平台打造的编程模型 Qwen-Coder-Qoder。该模型基于 Qwen-Coder,结合 Agent 框架与工具,通过 ROLL 框架训练,目前开启十五天免费体验,Free 用户每日有限额。

阿里 AI 编程工具 Qoder 正式发布为自身量身定制的强化学习模型 Qwen-Coder-Qoder。该模型基于 Qwen-Coder 基座,紧密结合其 Agent 框架与工具,通过自研的 ROLL 训练框架进行大规模强化学习,旨在提升端到端的编程体验。

根据官方数据,在面向真实软件工程任务的 Qoder Bench 评测中,该模型的任务解决率已超越 Cursor Composer-1,尤其在 Windows 系统下,其终端命令准确率领先幅度达到 50%。在实际线上应用中,该模型已将代码留存率提升了 3.85%,工具异常率降低了 61.5%,Token 消耗下降了 14.5%。

Qwen-Coder-Qoder 的设计遵循资深开发者思维模式,核心特性包括:严格遵守软件工程规范、具备项目全局感知能力、可高效并行处理无依赖任务,以及持续解决复杂问题的韧性。其研发基于“模型即 Agent”的智能进化体系,技术实现依赖三大要素:在真实 Agent 沙盒环境中学习、引入软件工程最佳实践作为奖励信号并通过“Rewarder - Attacker”对抗机制防止模型作弊,以及利用 ROLL 框架实现数千卡集群上 10 倍以上的训练吞吐提升。

目前,Qwen-Coder-Qoder 已在产品中正式上线。自发布之日起,Qoder 开启为期十五天的限时免费体验活动,所有用户均可参与。由于资源限制,Free 用户每日使用量设有上限,所有用户在高峰时段可能需要排队。

相关链接:


CircleStone发布文生图模型Anima预览版 #2

CircleStone Labs发布20亿参数文生图模型Anima预览版,专精动漫与非写实艺术风格。

CircleStone Labs与Comfy Org联合发布20亿参数文生图模型Anima预览版。该模型基于NVIDIA Cosmos架构,采用Qwen 3.0b文本编码器,在数百万张二次元图像及约80万张艺术图像上训练完成,全程未使用合成数据,知识截止2025年9月,遵循非商业许可协议。

相关链接:


开发生态

Claude Code官方发布团队内部技巧集 #3

Claude Code 创建者 Boris Cherny 分享了团队内部的高效使用技巧。建议使用 "use subagents" 调度算力,保持主上下文清晰,并通过 /statusline 自定义终端状态栏。在 CI 中运行 claude -p 检查代码重复,结合 Opus 4.5 处理权限请求,提升开发效率。

Claude Code 创建者 Boris Cherny 分享了该工具的官方团队内部使用技巧与工作流建议,旨在提升开发效率与代码质量。在自动化 Bug 修复方面,团队通过启用 Slack MCP 并粘贴讨论线程,或直接指向 Docker 日志与 CI 测试,即可指示 Claude Code 无缝修复 Bug,并可通过 /chrome (Chrome MCP) 在网页端验证变更。高级技巧包括使用 "use subagents" 指令调度更多算力以保持主 Agent 上下文整洁;利用 BigQuery 技能进行实时数据分析;以及在代码评审中要求 Claude Code 担任严格评审者,如使用 "Grill me on these changes"。环境配置上,用户可通过 /statusline 定制状态栏显示 Git 分支与上下文用量,或在 /config 中开启解释模式用于学习。针对大型代码库,推荐在 CI 中使用 claude -p 检查代码重复,并利用子 Agent 将权限请求路由至 Opus 4.5 处理。为优化体验,可通过 /permissions 预设授权。

相关链接:


技术与洞察

Kimi与南大发布SimpleSeg赋能模型像素感知 #4

Kimi 与南京大学联合发布 SimpleSeg,该方法将图像分割转化为点序列生成任务,通过监督微调与 IoU 奖励强化学习训练,在无需专用模块的情况下实现高精度轮廓预测。

Kimi Team联合南京大学发布SimpleSeg,通过将图像分割任务重构为序列生成问题,赋予多模态大语言模型(MLLM)原生像素级感知能力。该方法使模型直接在语言空间内预测物体边界的坐标点序列,采用SFT监督微调与基于IoU奖励的强化学习两阶段训练提升轮廓精度。官方表示,SimpleSeg在标准MLLM架构下无需任何专用模块,性能在多个分割基准测试中达到或超越复杂专用算法。其具备简单性、任务通用性及可解释输出三大核心优势,目前已基于Kimi-VL和Qwen2.5-VL实现模型应用。

相关链接:


字节研究团队发布ConceptMoE提升AI推理 #5

字节研究团队发布ConceptMoE,通过自适应合并语义相似Token,将处理单元从Token提升至概念级别。该架构在不增加计算量前提下,显著提升语言与多模态模型性能。

ByteDance研究团队近日发布ConceptMoE架构,通过可学习的自适应块化技术,将大语言模型处理从Token级别提升至概念级别。该架构利用可学习的Chunk模块识别最优边界,动态合并语义相似的Token序列为统一概念表示,实现隐式计算分配,对可预测序列进行压缩,对复杂Token则保留精细化计算,从而在不改变模型参数与计算量的前提下显著提升性能。

相关链接:


行业动态

Moltbook数据库泄露 #6

AI Agent 平台 Moltbook 因数据库完全暴露,导致攻击者可冒充发布虚假信息。

据社交媒体用户 Jamieson O'Reilly 披露,AI Agent 社交平台 Moltbook 近期曝出严重安全漏洞,其数据库在无任何保护的情况下对公众开放,导致包括知名 AI 专家 Andrej Karpathy 在内的所有平台 Agent 信息及私密 API key 泄露。攻击者可利用这些密钥冒充任意账号发布信息,存在被用于加密货币骗局、传播虚假言论等风险。

相关链接:


北京经开区颁发全国首个AI虚拟偶像身份认证 #7

北京经开区在人工智能产业创新发布会上,向AI虚拟偶像Yuri颁发全国首个虚拟偶像身份认证。Yuri由AI技术打造,粉丝超百万。同期启动模数OPC社区,旨在服务超级个体,未来两年将培育万名AI开发者。

北京经济技术开发区近日向AI虚拟偶像Yuri颁发全国首个虚拟偶像身份认证。Yuri由汗青工作室利用生成式AI技术打造,所属厂牌AI.TALK全网粉丝突破110万,首支MV播放量超1200万次,未来将作为“数字居民”探索智能座舱等多元场景。

北京经开区同步启动建设模数OPC社区,实体空间位于国家信创园,首期面积3000平方米,配备播客录音棚、轻量直播间等设施。国内头部AI社区WAYTOAGI已全面入驻运营,20家优质OPC企业现场签约。官方计划两年内培育10000名AI独立开发者,孵化200家高成长性超级个体企业。

相关链接:


前瞻与传闻

谷歌员工暗示三周内发布新内容 #8

Google DeepMind 员工 Omar Sanseviero 在社交平台暗示,团队将在三周内交付多项成果。社区推测,Google 可能会发布新模型。

Google DeepMind 员工 Omar Sanseviero 近日在社交平台X发帖暗示,其团队计划在未来三周内交付多项成果。此言论引发社区与媒体关注,外界普遍解读认为,这可能预示着Google将在未来三周内发布新模型或对AI Studio 进行重大改进。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误