2026-01-21 · Markdown

AI 早报 2026-01-21

概览

产品应用

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻


产品应用

OpenAI 推出 ChatGPT 年龄预测功能 #1

OpenAI 在 ChatGPT 消费者计划中上线年龄预测功能,依据账户行为估算用户是否未满18岁,以提供相应保护措施。该模型结合使用时长、活跃时段等信号,参考青少年发展研究,确保安全体验。系统默认对不确定账户启用更严格限制,包括屏蔽暴力、自残、不当角色扮演等内容。家长可设置静音时段、控制记忆等功能。误判用户可通过自拍验证恢复权限。该功能正全球推广,欧盟地区将于未来几周上线。

OpenAI 在 ChatGPT 消费者计划中上线 age prediction 功能,基于行为与账户信号估算用户是否可能为 18 岁以下,以提供青少年保护措施。该模型受 Teen Safety Blueprint 和学术研究指导,当年龄不确定时默认启用更安全体验。若判定为未成年人,系统将限制暴力、性、自残、极端审美等内容,并支持家长设置静音时段、关闭记忆等功能。用户可通过 Persona 身份验证恢复完整权限。OpenAI 称该功能正全球推广,欧盟地区将于未来几周上线,后续将根据反馈持续优化。

相关链接:


Anthropic 推出 Claude 健康数据连接功能 Beta 版 #2

Claude 推出健康数据连接功能,支持 Apple Health、Health Connect、HealthEx 和 Function Health,用户需在 app 或网页端授权接入。该功能目前为 Beta 版,仅限美国地区 Pro 和 Max 订阅用户使用,数据不会用于模型训练。

Anthropic 宣布 Claude 推出健康数据连接功能,开启 Beta 测试,支持 Apple Health、Health Connect、HealthEx 和 Function Health 四个渠道。用户需在 Claude App 内启动连接,HealthEx 与 Function 需通过网页端完成。功能启用需用户主动授权,官方承诺不将健康数据用于模型训练。连接后可实现病史总结、检测结果通俗化解释及跨指标分析。目前仅限美国地区 Pro 和 Max 订阅用户使用。社区反应不一,有用户表示或将更换平台,也有期待 AI 健康生态发展。部分用户关注数据保留策略与 API 开放可能性,并表达对 Oura Ring 集成的需求。

相关链接:


MiniMax发布Agent 2.0及桌面端AI工作空间 #3

MiniMax 推出 Agent 2.0 及桌面端,定义为 AI 原生工作区。支持本地文件深度处理与网页自动化操作。网页端上线可复用模板 Expert,覆盖财务、客服等场景,支持一键试用或自定义。

MiniMax 推出 Agent 2.0 及其桌面端,定义为 AI-native Workspace,推动 Agent 从对话工具转向工作流核心。桌面端支持本地文件深度集成与网页代理操作,可读取、分析并批量处理本地目录,自动执行网页任务。网页端上线可复用模板功能 Experts,支持将指令、模型偏好与行为封装为模板,用户可通过描述需求自动生成或手动配置,适用于财务、客户沟通、数据分析等场景。用户可试用社区 Experts 或复制自定义,常用模板可固定于侧边栏。

相关链接:


阿里巴巴推出AIGC创意设计平台呜哩 #4

阿里巴巴推出AIGC创意设计平台呜哩(wuli.art),目前处于测试阶段,面向创作者、设计师及营销人员。平台集成通义千问团队研发的多款图像与视频模型,包括Qwen Image系列、通义万相、即梦、可灵及Seedance等,并提供免费使用权限。

阿里巴巴推出AIGC创意设计平台呜哩(wuli.art),目前处于测试阶段,面向内容创作者、设计师及营销人员。平台集成通义千问团队研发的多款图像模型,包括Qwen Image 25.12(高质量生成)、Qwen Image Turbo(快速响应)、Qwen Image 25.11(细节编辑),并支持通义万相、即梦系列。视频生成方面接入可灵2.6、可灵O1、通义2.6及Seedance 1.5 Pro等模型。平台提供灵感联想助手、翻译工具与资源库。目前,通义万相、即梦、可灵、Seedance等主流模型在该平台免费开放使用。

相关链接:


模型发布

THUNLP联合发布AgentCPM-Report开源模型 #5

THUNLP、中国人民大学与面壁智能联合开源了大语言模型智能体 AgentCPM-Report。该模型基于 MiniCPM4.1-8B 构建,支持本地化部署,可生成万字级深度研究报告。它采用 UltraRAG 框架,通过多轮检索与思维链推演提升分析能力。在多项评测中表现优异,综合得分超过 Gemini-2.5-pro,支持离线部署,保障数据隐私。

THUNLP、中国人民大学与面壁智能联合开源了基于 MiniCPM4.1-8B 构建的智能体 AgentCPM-Report,支持本地部署与深度研究(DeepResearch)。该模型通过 UltraRAG 框架实现多轮检索与思维链推演,支持私有知识库接入,可生成万字级逻辑严密报告。提供 GGUF 格式版本,支持 CPU 推理,兼容 Docker-compose 一键部署。在 DeepResearch Bench 评测中综合得分 50.11,全面性 50.54、洞察力 52.64,优于 OpenAI-deepresearch(46.45)与 Gemini-2.5-Pro(49.71)。DeepResearch Gym 评测平均分 98.48,深度、广度、洞察力均达 100。DeepConsult 评测平均分 6.60,胜率 57.6%。基于约 270 万 Arxiv 数据与 20 万网页摘要训练,专为高隐私场景设计,实现“不出域”的私密数据决策转化。

相关链接:


Overworld发布Waypoint-1实时扩散世界模型 #6

Overworld 发布了名为 Waypoint-1 的实时扩散世界模型,支持消费级 GPU 本地运行,提供 61 亿和 23 亿参数两个版本,采用 Transformer 架构,可基于文本、动作和历史帧生成新画面。模型支持实时响应,目标帧率 60fps,推荐使用 RTX 5090 或 RTX 6000 Pro Blackwell 运行。主要工具为 Biome,支持流媒体客户端或 Hugging Face 使用。模型目前为研究预览,不支持生成人脸、动物或交互式 UI,且禁止用于暴力、色情或欺凌内容。

Overworld 发布 Waypoint-1 实时扩散世界模型研究预览,获 Kindred Ventures 领投 450 万美元种子前融资。模型含 Waypoint-1-Medium(61 亿参数)与 Waypoint-1-Small(23 亿参数),基于 Transformer 架构,支持文本与动作条件生成,实现本地实时推理。推荐 RTX 6000 Pro Blackwell 运行 Medium 版,RTX 5090 可运行 Small 版,目标达 60fps。支持 Continuations(自然演化)与 Generations(用户交互)两种输出模式,但存在文本忽略、无法生成人脸/动物/逼真运动、HUD 等局限。模型禁止用于暴力、性暗示、儿童伤害等用途。访问 Medium 版需提供邮箱与用户名,系统坚持本地优先,不依赖远程服务。官方强调当前版本为实验性,非最终发布标准。

相关链接:


Liquid AI 推出 LFM2.5-1.2B-Thinking 端侧推理模型 #7

Liquid AI 发布 LFM2.5 系列端侧模型,其中 LFM2.5-1.2B-Thinking 为 11.7 亿参数通用推理模型,支持多语言和工具调用,适用于 Agent 与 RAG 任务。该模型在 AMD、高通等设备上实现高效推理,内存占用低于 1GB,支持 GGUF、ONNX 等多种部署格式。

Liquid AI 推出 LFM2.5 系列端侧推理模型,其中 LFM2.5-1.2B-Thinking 为 11.7 亿参数通用文本推理模型,基于 LFM2 架构扩展预训练至 28T tokens 并融合多阶段强化学习。模型支持 32K 上下文长度,词表 65,536,覆盖八种语言,具备内部思考痕迹生成能力,适用于 Agent、数据提取与 RAG,不推荐用于知识密集或编程任务。基准测试显示其在 GPQA Diamond(37.86)、MMLU-Pro(49.65)、IFEval(88.42)、GSM8K(85.60)、MATH-500(87.96)等任务中表现优异,性能与 Qwen3-1.7B(thinking mode)相近但参数少 40%。支持多种部署格式(GGUF、ONNX、MLX、Transformers),可在 <1GB 内存设备运行,AMD Ryzen NPU 上解码达 57 tok/s,高通 Gen4 NPU 上达 82 tok/s。兼容 Unsloth 与 TRL 框架进行 LoRA/SFT、DPO 等微调,支持 Python/JSON 工具调用。系列还包括 Base、Instruct、JP、VL(1.6B)、Audio(1.5B)等模型,合作 AMD、高通、Nexa AI、FastFlowLM 推动在汽车、移动、IoT 等场景落地。

相关链接:


LightOn发布第二代OCR模型LightOnOCR-2 #8

LightOn 发布了第二代视觉语言模型 LightOnOCR-2,一款 10 亿参数的端到端 OCR 模型,支持企业文档智能处理。该模型采用 Apache 2.0 开源协议,包含多个变体,支持文本与图表定位。基于强化学习训练,性能超越比其大 9 倍的模型,推理效率高,成本低。支持 Hugging Face 和 vLLM 部署,已集成至其 Paradigm 平台,支持本地化部署。

LightOn 发布第二代视觉语言模型 LightOnOCR-2-1B,一款 10 亿参数的端到端 OCR 模型,支持将 PDF、扫描件等企业文档直接转为结构化文本或 Markdown。该模型为 Apache 2.0 开源,包含多个变体,涵盖 OCR、图像定位与基础微调需求。采用全微分架构,结合 RLVR 训练,强化对 KaTeX 与格式的建模,减少 50% 以上重复生成。训练数据为前代 2.5 倍,覆盖法语、科学文献等。在 OlmOCR-Bench 得分 83.2±0.9,性能优于 Chandra-9B。单张 H100 GPU 推理速度达 5.71 页/秒,成本低于 0.01 美元/千页。支持 Hugging Face Transformers 与 vLLM 部署,推荐图像分辨率 1540 像素。模型已集成至 LightOn Paradigm 平台,支持本地化部署。

相关链接:


开发生态

OpenRouter发布Response Healing插件自动修复JSON格式错误 #9

OpenRouter发布Response Healing插件,可自动修复AI生成的格式错误JSON。该插件支持非流式请求,需在API调用中启用plugins参数。它能处理括号、引号、逗号等语法错误,并从Markdown中提取有效数据。系统基于实时错误检测和AI分析持续优化,提升JSON生成准确性。

OpenRouter 发布 Response Healing 插件,可自动修复大语言模型生成的格式错误 JSON,支持缺失括号、引号、尾随逗号等问题,并能从 Markdown 或混合文本中提取有效 JSON。基于超 500 万次请求数据,系统针对常见错误提供优化建议:返回数组时建议 schema 使用 {"type": "array"},返回字符串则建议在提示中明确要求 JSON。插件通过实时 JSON 故障检测与 AI 分析实现自我改进,仅适用于非流式请求,需在 API 请求中配置 plugins: [{ id: 'response-healing' }]。API 路径为 api/v1/chat/completions,需设置 AuthorizationContent-Typeresponse_format 需指定 json_schemajson_object 并定义 schema 结构。修复后 JSON 通过 data.choices[0].message.content 获取。

相关链接:


llama.cpp 集成 Anthropic Messages API #10

llama.cpp server 现已支持 Anthropic Messages API,兼容 Claude Code 等应用。通过本地部署,用户可使用 GGUF 模型连接服务,设置环境变量即可接入。支持流式聊天、Token 统计、工具调用、多模态图片输入及推理扩展模式,全面适配 Anthropic 标准。

llama.cpp server 已集成 Anthropic Messages API,支持 Claude Code 等兼容应用连接本地模型。该功能通过 PR #17570 实现,将 Anthropic 格式转换为 OpenAI 格式并复用推理流水线。支持 /v1/messages 流式聊天补全与 /v1/messages/count_tokens Token 统计,涵盖工具调用(tool_use/tool_result)、Vision 能力(依赖多模态 GGUF 模型)、thinking 扩展思考模式及标准 SSE 事件。部署需使用 GGUF 模型,设置 ANTHROPIC_BASE_URL=http://127.0.0.1:8080。请求支持 modelmax_tokenssystemmessages 参数,工具调用需包含 tools 数组与 input_schema。文档推荐 Nemotron、Qwen3 Coder、Kimi K2、MiniMax M2 等模型用于 Agentic 场景。Hugging Face 用户 marksverdhei 称该更新可替代 claude router,并计划集成 GLM4.7-flash。

相关链接:


Anthropic 推出 Claude Code VS Code 扩展 #11

Claude AI 宣布 Claude Code 的 VS Code 扩展已上线。该扩展提供原生图形界面,支持在 IDE 中直接使用,用户可审查或自动接受编辑,使用 @-mentions 引用代码行,管理多对话,并通过快捷键 Alt+K 插入引用。支持三种权限模式,集成 Git 与终端,兼容 Anthropic 及第三方模型。需 VS Code 1.98.0 以上版本和账户。

Claude AI 宣布 Claude Code 的 VS Code 扩展正式上线,提供原生图形界面并集成至 IDE。用户可审查或自动接受 Claude 的编辑建议,支持 @-mentions 引用文件行范围,访问对话历史,并在多标签页中管理对话。扩展支持三种权限模式:Normal、Plan 和 Auto-accept,默认通过 claudeCode.initialPermissionMode 配置。集成 CLI 可通过终端访问,共享 ~/.claude/settings.json 设置与对话历史,支持 claude --resume 续会及 /ide 连接外部终端。MCP 服务器通过 CLI 配置后可在扩展中使用。快捷键 Option+K(Mac)或 Alt+K(Win/Linux)插入 @-mention,多行输入用 Shift+Enter。命令菜单(/)支持附加文件、切换模型、查看用量等。支持 Git 操作,包括暂存、提交、PR 创建及多分支会话。需 VS Code 1.98.0+ 及 Anthropic 账户,兼容 Amazon Bedrock、Google Vertex AI、Microsoft Foundry。部分命令不支持,后台任务可见性受限。Spark 图标仅在打开文件时显示。扩展未出现时需重启或重载窗口。代码私密,不用于模型训练;自动编辑可修改配置文件,处理不信任代码时建议启用 Restricted Mode 或手动批准。无响应时检查网络、新建对话或使用 CLI 获取错误信息。

相关链接:


X 公司开源 For You 推荐算法 #12

X公司工程团队开源了“为你推荐”信息流的新推荐算法,该算法基于xAI的Grok模型架构。Elon Musk表示算法尚不完善,通过每4周一次的代码更新和开发者说明实现透明改进。相关代码已发布于GitHub的x-algorithm仓库。

X 公司 Engineering 团队开源了驱动“为你推荐”信息流的新推荐算法,代码涵盖自然推文与广告推荐逻辑。该算法基于 xAI Grok 模型的 Transformer 架构。Elon Musk 表示算法当前“笨拙”,需改进,并称开源旨在提升透明度与性能,且为行业首创。新代码每 7 天首次开源,此后每 4 周更新一次,每次附带完整开发者说明。相关代码已发布于 GitHub 的 x-algorithm 仓库。

相关链接:


Xiaomi MiMo API开放充值与定价 #13

Xiaomi MiMo API 开放平台已开放充值功能,建议用户提前充值避免服务中断。国内输入0.7元/M tokens,输出2.1元/M tokens;海外输入0.1美元,输出0.3美元。新老用户均享免费额度,登录即可查看。

Xiaomi MiMo API 开放平台宣布充值功能上线,建议用户提前充值以保障服务连续性。MiMo-V2-Flash API 定价如下:国内输入 ¥0.7/M tokens(命中缓存 ¥0.07),输出 ¥2.1/M tokens;海外输入 $0.1/M tokens(命中缓存 $0.01),输出 $0.3/M tokens。平台已为新老用户发放专属免费额度,用户可登录账户查看。

相关链接:


技术与洞察

BlinkDL发布RWKV-v8及ROSA架构 #14

BlinkDL 发布 RWKV-v8 及其 ROSA 变体,该架构结合 RNN 与 Transformer 特性,支持并行训练、线性时间复杂度和无限上下文。40K 参数模型在数字反转任务中精度达 99.8%,100 万参数模型处理 40 位加减法精度为 99%。

RWKV 项目发布 RWKV-v8 及其 ROSA(Recursive Operator Selective Attention)变体。RWKV 是一种结合 RNN 与 Transformer 特性的架构,具备线性时间复杂度、恒定空间占用、无需 KV-cache、支持无限上下文长度及免费句子嵌入。当前处于 RWKV-7 “Goose” 阶段,RWKV-8 ROSA 为后续演进版本。

测试显示,40K 参数模型在反转数字任务中精度达 99.8%;100 万参数模型在无思维链情况下处理 40 位加减法精度为 99%。训练损失方面,rosa_onlyemb、rosa_1bit、rosa_4bit 配置分别约为 0.65、0.4、0.25。社区已出现 rosa_soft、ROSA-Tuning、rosa-plus、RASP 等配套工具。

相关链接:


Sam Altman与Elon Musk就ChatGPT安全问题展开公开争论 #15

Sam Altman 与 Elon Musk 就 ChatGPT 安全性公开争论。Musk 指控 ChatGPT 关联多起死亡案例,Altman 回应称平台有近 10 亿用户,部分处于脆弱状态,安全护栏需平衡保护与可用性。他同时批评特斯拉 Autopilot 安全性不足,并对 Musk 的指控回应称其将每条批评视为自白。

Sam Altman 与 Elon Musk 就 ChatGPT 安全性公开交锋。Musk 称 ChatGPT 关联 9 起死亡案例,其中 5 起涉自杀,受害者含青少年。Altman 回应称 ChatGPT 用户近 10 亿,部分用户心理脆弱,平台需平衡安全护栏与可用性,此问题“悲剧且复杂”。他提及特斯拉 Autopilot 已致超 50 人死,批评其安全性不足,并称 Musk 将指控视作自白。Altman 表示 OpenAI 负责处理相关问题,但对 Grok 决策不作评论。

相关链接:


DeepSeek 更新 FlashMLA 源码曝光 model1 架构 #16

DeepSeek 更新其 FlashMLA 源码,引入名为 model1 的新架构。该架构支持英伟达 Hopper 与下一代 SM100 架构,优化显存效率与推理精度,并已体现在 GitHub 仓库中。

DeepSeek 的 FlashMLA 源码库近期更新,出现名为 model1 的新模型引用。该库为支持 DeepSeek-V3 系列优化注意力核,现新增对英伟达 SM100 架构的支持,并引入统一 512 维度、值向量位置感知机制及疑似 Engram 和 DSA 技术,旨在提升显存效率与推理精度。代码中定义了 FlashMLASchedMeta 结构体,包含 b、s_q、h_q、page_block_size 和 h_k 五个 int 类型配置参数。GitHub 仓库更新发生于 2026 年 1 月 20 日前四天内。TestingCatalog News 指出 model1 或为 V3 系列提供动力,Zhipeng Huang 在 AAAI 2026 表示其或已临近,Linux.do 社区猜测可能预示 V4 版本。

相关链接:


行业动态

月之暗面估值达48亿美元并开启Kimi新模型API内测 #17

月之暗面完成5亿美元C轮融资,估值达48亿美元,现金超百亿元。公司创始人杨植麟表示,资金将用于研发下一代模型Kimi K3,强调其不仅是算力堆叠,更是架构与审美的综合演进。同时,Kimi开放平台开启视觉模型API内测,仅限认证企业用户申请。

月之暗面完成C轮融资5亿美元,估值达48亿美元,较2025年12月增长5亿。公司现金超百亿元。Kimi开放平台启动新视觉模型API内测,仅限认证企业用户申请。下一代模型Kimi K3将在K2基础上进行架构与数据演进,强调“品味”等非同质化特性。

相关链接:


humans& 成立并获4.8亿美元融资 #18

初创公司 humans& 宣布成立,定位为以人为中心的前沿 AI 实验室。团队由 Anthropic、Google、xAI 及斯坦福学者组成,聚焦多智能体强化学习与用户理解。公司已完成 4.8 亿美元种子轮融资,估值 44.8 亿美元,投资方包括英伟达、贝索斯等。

初创公司 humans& 宣布成立,定位为“以人为中心”的前沿 AI 实验室,联合创始人 Eric Zelikman 表示其目标是让 AI 成为强化组织与社区的“连接纽带”,并提出“love is all you need”为核心理念。创始团队包括前 Anthropic 研究员 Andi Peng、Google 第七号员工 Georges Harik、前 xAI 成员 Eric Zelikman 与 Yuchen He,以及斯坦福教授 Noah Goodman。公司聚焦长程多智能体强化学习、记忆与用户理解,探索大规模模型训练与人机交互新范式。产品方向为促进人际协作的 AI 即时通讯应用,设想让 Chatbot 主动请求并存储用户信息。据《纽约时报》,成立三个月即完成 4.8 亿美元种子轮融资,估值 44.8 亿美元,投资方包括英伟达、Jeff Bezos、SV Angel、谷歌创投及 Emerson Collective。目前团队约 20 人,成员来自 OpenAI、Meta、MIT 等机构。

相关链接:


前瞻与传闻

Sam Altman确认GPT-5.3存在并征集用户反馈 #19

Sam Altman 确认 GPT-5.3 存在,正征集用户改进建议。短期内不会推出 GPT-5.5,具体功能与发布时间尚未公布。

Sam Altman 确认 GPT-5.3 存在,并向用户征集功能反馈与改进建议。据转述信息,GPT-5.3 推出后短期内不会发布 GPT-5.5。目前尚未披露该版本的具体功能、发布时间或技术细节。

相关链接:


Codex将新增多智能体协同功能 #20

Codex 即将上线多智能体功能,可生成并协同其他智能体解决问题。该更新被部分网友称为重大升级。

Codex 即将上线多智能体功能,支持生成并协同其他智能体解决问题。据 Morgan 描述,该能力允许 Codex 动态创建智能体并协作执行任务。社交媒体有用户评论称此更新重大,并调侃需“牺牲一个器官”才能投入工作。

相关链接:


Tesla重启Dojo3项目转向太空AI计算 #21

Elon Musk 宣布重启 Tesla 的 Dojo3 AI 芯片项目,定位为太空 AI 计算“moonshot”计划。该项目原为地面自动驾驶训练,现转向利用 Starship 发射计算卫星群。AI5 芯片由 TSMC 制造,AI6 芯片将由三星代工。Tesla 正重建团队,招募工程师参与芯片研发。

Elon Musk 宣布重启 Tesla 前期搁置的 Dojo3 AI 芯片项目,定位为“太空 AI 计算”(space-based AI compute)的“moonshot”计划。该项目不再用于地面自动驾驶训练,而是支持 Starship 发射的计算卫星群,以实现持续太阳能供电的数据中心。Musk 表示 AI5 芯片设计进展顺利,由 TSMC 制造,用于 FSD 和 Optimus;AI6 芯片将由三星代工,价值 165 亿美元,2025 年夏季签约。Tesla 正重建此前解散的 Dojo 团队,Musk 在 X 上招募工程师,邮箱为 AI_Chips@Tesla.com。Axios 报道称,Musk 计划利用 SpaceX IPO 资助太空愿景,而 OpenAI CEO Sam Altman 也对轨道数据中心感兴趣,但 Musk 拥有运载工具优势。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误