# AI 早报 2026-01-21

## 概览
### 产品应用
- OpenAI 推出 ChatGPT 年龄预测功能 [↗](https://openai.com/index/our-approach-to-age-prediction/) `#1`
- Anthropic 推出 Claude 健康数据连接功能 Beta 版 [↗](https://claude.com/connectors) `#2`
- MiniMax发布Agent 2.0及桌面端AI工作空间 [↗](https://mp.weixin.qq.com/s/TY57Eyun6BJsqTavh742rQ) `#3`
- 阿里巴巴推出AIGC创意设计平台呜哩 [↗](https://wuli.art/generate) `#4`
### 模型发布
- THUNLP联合发布AgentCPM-Report开源模型 [↗](https://modelscope.cn/models/OpenBMB/AgentCPM-Report) `#5`
- Overworld发布Waypoint-1实时扩散世界模型 [↗](https://huggingface.co/Overworld/Waypoint-1-Medium) `#6`
- Liquid AI 推出 LFM2.5-1.2B-Thinking 端侧推理模型 [↗](https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking) `#7`
- LightOn发布第二代OCR模型LightOnOCR-2 [↗](https://huggingface.co/lightonai/LightOnOCR-2-1B) `#8`
### 开发生态
- OpenRouter发布Response Healing插件自动修复JSON格式错误 [↗](https://openrouter.ai/docs/guides/features/plugins/response-healing) `#9`
- llama.cpp 集成 Anthropic Messages API [↗](https://huggingface.co/blog/ggml-org/anthropic-messages-api-in-llamacpp) `#10`
- Anthropic 推出 Claude Code VS Code 扩展 [↗](https://code.claude.com/docs/en/vs-code) `#11`
- X 公司开源 For You 推荐算法 [↗](https://github.com/xai-org/x-algorithm) `#12`
- Xiaomi MiMo API开放充值与定价 [↗](https://platform.xiaomimimo.com/) `#13`
### 技术与洞察
- BlinkDL发布RWKV-v8及ROSA架构 [↗](https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v8) `#14`
- Sam Altman与Elon Musk就ChatGPT安全问题展开公开争论 [↗](https://x.com/sama/status/2013703158459978076) `#15`
- DeepSeek 更新 FlashMLA 源码曝光 model1 架构 [↗](https://github.com/deepseek-ai/FlashMLA/blob/main/flash_mla/flash_mla_interface.py) `#16`
### 行业动态
- 月之暗面估值达48亿美元并开启Kimi新模型API内测 [↗](https://mp.weixin.qq.com/s/1HCpiM28VVoHHgeLQoKanQ) `#17`
- humans& 成立并获4.8亿美元融资 [↗](https://humansand.ai/) `#18`
### 前瞻与传闻
- Sam Altman确认GPT-5.3存在并征集用户反馈 [↗](https://x.com/sama/status/2013404302400712757?s=20) `#19`
- Codex将新增多智能体协同功能 [↗](https://x.com/morqon/status/2013661492306948384) `#20`
- Tesla重启Dojo3项目转向太空AI计算 [↗](https://techcrunch.com/2026/01/20/elon-musk-says-teslas-restarted-dojo3-will-be-for-space-based-ai-compute) `#21`

---

## 产品应用

### [OpenAI 推出 ChatGPT 年龄预测功能](https://openai.com/index/our-approach-to-age-prediction/) `#1`
> OpenAI 在 ChatGPT 消费者计划中上线年龄预测功能，依据账户行为估算用户是否未满18岁，以提供相应保护措施。该模型结合使用时长、活跃时段等信号，参考青少年发展研究，确保安全体验。系统默认对不确定账户启用更严格限制，包括屏蔽暴力、自残、不当角色扮演等内容。家长可设置静音时段、控制记忆等功能。误判用户可通过自拍验证恢复权限。该功能正全球推广，欧盟地区将于未来几周上线。

OpenAI 在 ChatGPT 消费者计划中上线 age prediction 功能，基于行为与账户信号估算用户是否可能为 18 岁以下，以提供青少年保护措施。该模型受 Teen Safety Blueprint 和学术研究指导，当年龄不确定时默认启用更安全体验。若判定为未成年人，系统将限制暴力、性、自残、极端审美等内容，并支持家长设置静音时段、关闭记忆等功能。用户可通过 Persona 身份验证恢复完整权限。OpenAI 称该功能正全球推广，欧盟地区将于未来几周上线，后续将根据反馈持续优化。

相关链接：
- [https://openai.com/index/our-approach-to-age-prediction/](https://openai.com/index/our-approach-to-age-prediction/)

---

### [Anthropic 推出 Claude 健康数据连接功能 Beta 版](https://claude.com/connectors) `#2`
> Claude 推出健康数据连接功能，支持 Apple Health、Health Connect、HealthEx 和 Function Health，用户需在 app 或网页端授权接入。该功能目前为 Beta 版，仅限美国地区 Pro 和 Max 订阅用户使用，数据不会用于模型训练。

Anthropic 宣布 Claude 推出健康数据连接功能，开启 Beta 测试，支持 Apple Health、Health Connect、HealthEx 和 Function Health 四个渠道。用户需在 Claude App 内启动连接，HealthEx 与 Function 需通过网页端完成。功能启用需用户主动授权，官方承诺不将健康数据用于模型训练。连接后可实现病史总结、检测结果通俗化解释及跨指标分析。目前仅限美国地区 Pro 和 Max 订阅用户使用。社区反应不一，有用户表示或将更换平台，也有期待 AI 健康生态发展。部分用户关注数据保留策略与 API 开放可能性，并表达对 Oura Ring 集成的需求。

相关链接：
- [https://claude.com/connectors](https://claude.com/connectors)

---

### [MiniMax发布Agent 2.0及桌面端AI工作空间](https://mp.weixin.qq.com/s/TY57Eyun6BJsqTavh742rQ) `#3`
> MiniMax 推出 Agent 2.0 及桌面端，定义为 AI 原生工作区。支持本地文件深度处理与网页自动化操作。网页端上线可复用模板 Expert，覆盖财务、客服等场景，支持一键试用或自定义。

MiniMax 推出 Agent 2.0 及其桌面端，定义为 AI-native Workspace，推动 Agent 从对话工具转向工作流核心。桌面端支持本地文件深度集成与网页代理操作，可读取、分析并批量处理本地目录，自动执行网页任务。网页端上线可复用模板功能 Experts，支持将指令、模型偏好与行为封装为模板，用户可通过描述需求自动生成或手动配置，适用于财务、客户沟通、数据分析等场景。用户可试用社区 Experts 或复制自定义，常用模板可固定于侧边栏。

相关链接：
- [https://mp.weixin.qq.com/s/TY57Eyun6BJsqTavh742rQ](https://mp.weixin.qq.com/s/TY57Eyun6BJsqTavh742rQ)
- [https://agent.minimaxi.com/](https://agent.minimaxi.com/)

---

### [阿里巴巴推出AIGC创意设计平台呜哩](https://wuli.art/generate) `#4`
> 阿里巴巴推出AIGC创意设计平台呜哩（wuli.art），目前处于测试阶段，面向创作者、设计师及营销人员。平台集成通义千问团队研发的多款图像与视频模型，包括Qwen Image系列、通义万相、即梦、可灵及Seedance等，并提供免费使用权限。

阿里巴巴推出AIGC创意设计平台呜哩（wuli.art），目前处于测试阶段，面向内容创作者、设计师及营销人员。平台集成通义千问团队研发的多款图像模型，包括Qwen Image 25.12（高质量生成）、Qwen Image Turbo（快速响应）、Qwen Image 25.11（细节编辑），并支持通义万相、即梦系列。视频生成方面接入可灵2.6、可灵O1、通义2.6及Seedance 1.5 Pro等模型。平台提供灵感联想助手、翻译工具与资源库。目前，通义万相、即梦、可灵、Seedance等主流模型在该平台免费开放使用。

相关链接：
- [https://wuli.art/generate](https://wuli.art/generate)

---

## 模型发布

### [THUNLP联合发布AgentCPM-Report开源模型](https://modelscope.cn/models/OpenBMB/AgentCPM-Report) `#5`
> THUNLP、中国人民大学与面壁智能联合开源了大语言模型智能体 AgentCPM-Report。该模型基于 MiniCPM4.1-8B 构建，支持本地化部署，可生成万字级深度研究报告。它采用 UltraRAG 框架，通过多轮检索与思维链推演提升分析能力。在多项评测中表现优异，综合得分超过 Gemini-2.5-pro，支持离线部署，保障数据隐私。

THUNLP、中国人民大学与面壁智能联合开源了基于 MiniCPM4.1-8B 构建的智能体 AgentCPM-Report，支持本地部署与深度研究（DeepResearch）。该模型通过 UltraRAG 框架实现多轮检索与思维链推演，支持私有知识库接入，可生成万字级逻辑严密报告。提供 GGUF 格式版本，支持 CPU 推理，兼容 Docker-compose 一键部署。在 DeepResearch Bench 评测中综合得分 50.11，全面性 50.54、洞察力 52.64，优于 OpenAI-deepresearch（46.45）与 Gemini-2.5-Pro（49.71）。DeepResearch Gym 评测平均分 98.48，深度、广度、洞察力均达 100。DeepConsult 评测平均分 6.60，胜率 57.6%。基于约 270 万 Arxiv 数据与 20 万网页摘要训练，专为高隐私场景设计，实现“不出域”的私密数据决策转化。

![](https://pbs.twimg.com/media/G_Gyjb_XMAAk5jb?format=jpg&name=orig)

![](https://pbs.twimg.com/media/G_GykZdWYAAaK8-?format=jpg&name=orig)

![](https://pbs.twimg.com/media/G_GylehXMAAqc0r?format=jpg&name=orig)

![](https://www.bilibili.com/video/BV1DYkLBNE6f)

![](https://www.bilibili.com/video/BV1Kfk5BtEbG)

相关链接：
- [https://modelscope.cn/models/OpenBMB/AgentCPM-Report](https://modelscope.cn/models/OpenBMB/AgentCPM-Report)
- [https://modelscope.cn/openbmb/AgentCPM-Report](https://modelscope.cn/openbmb/AgentCPM-Report)
- [https://modelscope.cn/openbmb/AgentCPM-Report-GGUF](https://modelscope.cn/openbmb/AgentCPM-Report-GGUF)
- [https://modelscope.cn/openbmb/AgentCPM-Explore](https://modelscope.cn/openbmb/AgentCPM-Explore)
- [https://modelscope.cn/openbmb/AgentCPM-Explore-GGUF](https://modelscope.cn/openbmb/AgentCPM-Explore-GGUF)
- [https://github.com/OpenBMB/AgentCPM](https://github.com/OpenBMB/AgentCPM)
- [https://github.com/OpenBMB/UltraRAG](https://github.com/OpenBMB/UltraRAG)
- [https://github.com/OpenBMB/MiniCPM](https://github.com/OpenBMB/MiniCPM)
- [https://ultrarag.openbmb.cn/pages/cn/demo/deepresearch](https://ultrarag.openbmb.cn/pages/cn/demo/deepresearch)
- [https://modelbest.cn/en](https://modelbest.cn/en)
- [https://nlp.csai.tsinghua.edu.cn/](https://nlp.csai.tsinghua.edu.cn/)
- [https://github.com/RUCBM](https://github.com/RUCBM)
- [https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark/tree/master/corpus/wiki24](https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark/tree/master/corpus/wiki24)
- [https://www.kaggle.com/api/v1/datasets/download/Cornell-University/arxiv](https://www.kaggle.com/api/v1/datasets/download/Cornell-University/arxiv)
- [https://surveygo.modelbest.cn/](https://surveygo.modelbest.cn/)
- [https://x.com/OpenBMB/status/2013587268599194107](https://x.com/OpenBMB/status/2013587268599194107)

---

### [Overworld发布Waypoint-1实时扩散世界模型](https://huggingface.co/Overworld/Waypoint-1-Medium) `#6`
> Overworld 发布了名为 Waypoint-1 的实时扩散世界模型，支持消费级 GPU 本地运行，提供 61 亿和 23 亿参数两个版本，采用 Transformer 架构，可基于文本、动作和历史帧生成新画面。模型支持实时响应，目标帧率 60fps，推荐使用 RTX 5090 或 RTX 6000 Pro Blackwell 运行。主要工具为 Biome，支持流媒体客户端或 Hugging Face 使用。模型目前为研究预览，不支持生成人脸、动物或交互式 UI，且禁止用于暴力、色情或欺凌内容。

Overworld 发布 Waypoint-1 实时扩散世界模型研究预览，获 Kindred Ventures 领投 450 万美元种子前融资。模型含 Waypoint-1-Medium（61 亿参数）与 Waypoint-1-Small（23 亿参数），基于 Transformer 架构，支持文本与动作条件生成，实现本地实时推理。推荐 RTX 6000 Pro Blackwell 运行 Medium 版，RTX 5090 可运行 Small 版，目标达 60fps。支持 Continuations（自然演化）与 Generations（用户交互）两种输出模式，但存在文本忽略、无法生成人脸/动物/逼真运动、HUD 等局限。模型禁止用于暴力、性暗示、儿童伤害等用途。访问 Medium 版需提供邮箱与用户名，系统坚持本地优先，不依赖远程服务。官方强调当前版本为实验性，非最终发布标准。

![](https://cdn.sanity.io/images/kb1bvjxo/production/71c3853fc46f546adefbae49fe640ec46831744e-828x466.gif?w=3840&q=75&fit=max&auto=format)

相关链接：
- [https://huggingface.co/Overworld/Waypoint-1-Medium](https://huggingface.co/Overworld/Waypoint-1-Medium)
- [https://huggingface.co/Overworld/Waypoint-1-Small](https://huggingface.co/Overworld/Waypoint-1-Small)
- [https://over.world/blog/the-path-to-real-time-worlds-and-why-it-matters](https://over.world/blog/the-path-to-real-time-worlds-and-why-it-matters)

---

### [Liquid AI 推出 LFM2.5-1.2B-Thinking 端侧推理模型](https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking) `#7`
> Liquid AI 发布 LFM2.5 系列端侧模型，其中 LFM2.5-1.2B-Thinking 为 11.7 亿参数通用推理模型，支持多语言和工具调用，适用于 Agent 与 RAG 任务。该模型在 AMD、高通等设备上实现高效推理，内存占用低于 1GB，支持 GGUF、ONNX 等多种部署格式。

Liquid AI 推出 LFM2.5 系列端侧推理模型，其中 LFM2.5-1.2B-Thinking 为 11.7 亿参数通用文本推理模型，基于 LFM2 架构扩展预训练至 28T tokens 并融合多阶段强化学习。模型支持 32K 上下文长度，词表 65,536，覆盖八种语言，具备内部思考痕迹生成能力，适用于 Agent、数据提取与 RAG，不推荐用于知识密集或编程任务。基准测试显示其在 GPQA Diamond（37.86）、MMLU-Pro（49.65）、IFEval（88.42）、GSM8K（85.60）、MATH-500（87.96）等任务中表现优异，性能与 Qwen3-1.7B（thinking mode）相近但参数少 40%。支持多种部署格式（GGUF、ONNX、MLX、Transformers），可在 <1GB 内存设备运行，AMD Ryzen NPU 上解码达 57 tok/s，高通 Gen4 NPU 上达 82 tok/s。兼容 Unsloth 与 TRL 框架进行 LoRA/SFT、DPO 等微调，支持 Python/JSON 工具调用。系列还包括 Base、Instruct、JP、VL（1.6B）、Audio（1.5B）等模型，合作 AMD、高通、Nexa AI、FastFlowLM 推动在汽车、移动、IoT 等场景落地。

![](https://preview.redd.it/nazcfmti1jeg1.jpeg?width=640&crop=smart&auto=webp&s=d85adead4df4e2a21194a3e6ae29b3752731c529)

相关链接：
- [https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking](https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking)

---

### [LightOn发布第二代OCR模型LightOnOCR-2](https://huggingface.co/lightonai/LightOnOCR-2-1B) `#8`
> LightOn 发布了第二代视觉语言模型 LightOnOCR-2，一款 10 亿参数的端到端 OCR 模型，支持企业文档智能处理。该模型采用 Apache 2.0 开源协议，包含多个变体，支持文本与图表定位。基于强化学习训练，性能超越比其大 9 倍的模型，推理效率高，成本低。支持 Hugging Face 和 vLLM 部署，已集成至其 Paradigm 平台，支持本地化部署。

LightOn 发布第二代视觉语言模型 LightOnOCR-2-1B，一款 10 亿参数的端到端 OCR 模型，支持将 PDF、扫描件等企业文档直接转为结构化文本或 Markdown。该模型为 Apache 2.0 开源，包含多个变体，涵盖 OCR、图像定位与基础微调需求。采用全微分架构，结合 RLVR 训练，强化对 KaTeX 与格式的建模，减少 50% 以上重复生成。训练数据为前代 2.5 倍，覆盖法语、科学文献等。在 OlmOCR-Bench 得分 83.2±0.9，性能优于 Chandra-9B。单张 H100 GPU 推理速度达 5.71 页/秒，成本低于 0.01 美元/千页。支持 Hugging Face Transformers 与 vLLM 部署，推荐图像分辨率 1540 像素。模型已集成至 LightOn Paradigm 平台，支持本地化部署。

![](https://pbs.twimg.com/media/G_CzbkoXgAAyRrf?format=png&name=900x900)

![](https://cdn.prod.website-files.com/6668dab2882cdb0ec42fe47e/696f52fad546f3f075ce25d9_Bench%20LightOn%20OCR%202.png)

相关链接：
- [https://huggingface.co/lightonai/LightOnOCR-2-1B](https://huggingface.co/lightonai/LightOnOCR-2-1B)
- [https://huggingface.co/blog/lightonai/lightonocr-2](https://huggingface.co/blog/lightonai/lightonocr-2)

---

## 开发生态

### [OpenRouter发布Response Healing插件自动修复JSON格式错误](https://openrouter.ai/docs/guides/features/plugins/response-healing) `#9`
> OpenRouter发布Response Healing插件，可自动修复AI生成的格式错误JSON。该插件支持非流式请求，需在API调用中启用plugins参数。它能处理括号、引号、逗号等语法错误，并从Markdown中提取有效数据。系统基于实时错误检测和AI分析持续优化，提升JSON生成准确性。

OpenRouter 发布 Response Healing 插件，可自动修复大语言模型生成的格式错误 JSON，支持缺失括号、引号、尾随逗号等问题，并能从 Markdown 或混合文本中提取有效 JSON。基于超 500 万次请求数据，系统针对常见错误提供优化建议：返回数组时建议 schema 使用 `{"type": "array"}`，返回字符串则建议在提示中明确要求 JSON。插件通过实时 JSON 故障检测与 AI 分析实现自我改进，仅适用于非流式请求，需在 API 请求中配置 `plugins: [{ id: 'response-healing' }]`。API 路径为 `api/v1/chat/completions`，需设置 `Authorization` 和 `Content-Type`，`response_format` 需指定 `json_schema` 或 `json_object` 并定义 schema 结构。修复后 JSON 通过 `data.choices[0].message.content` 获取。

![](https://pbs.twimg.com/media/G8du9UQWsAsZU4R?format=jpg&name=large)

相关链接：
- [https://openrouter.ai/docs/guides/features/plugins/response-healing](https://openrouter.ai/docs/guides/features/plugins/response-healing)
- [https://x.com/OpenRouterAI/status/2013652332450320726](https://x.com/OpenRouterAI/status/2013652332450320726)

---

### [llama.cpp 集成 Anthropic Messages API](https://huggingface.co/blog/ggml-org/anthropic-messages-api-in-llamacpp) `#10`
> llama.cpp server 现已支持 Anthropic Messages API，兼容 Claude Code 等应用。通过本地部署，用户可使用 GGUF 模型连接服务，设置环境变量即可接入。支持流式聊天、Token 统计、工具调用、多模态图片输入及推理扩展模式，全面适配 Anthropic 标准。

llama.cpp server 已集成 Anthropic Messages API，支持 Claude Code 等兼容应用连接本地模型。该功能通过 PR #17570 实现，将 Anthropic 格式转换为 OpenAI 格式并复用推理流水线。支持 `/v1/messages` 流式聊天补全与 `/v1/messages/count_tokens` Token 统计，涵盖工具调用（`tool_use`/`tool_result`）、Vision 能力（依赖多模态 GGUF 模型）、`thinking` 扩展思考模式及标准 SSE 事件。部署需使用 GGUF 模型，设置 `ANTHROPIC_BASE_URL=http://127.0.0.1:8080`。请求支持 `model`、`max_tokens`、`system` 及 `messages` 参数，工具调用需包含 `tools` 数组与 `input_schema`。文档推荐 Nemotron、Qwen3 Coder、Kimi K2、MiniMax M2 等模型用于 Agentic 场景。Hugging Face 用户 marksverdhei 称该更新可替代 claude router，并计划集成 GLM4.7-flash。

![](https://cdn-uploads.huggingface.co/production/uploads/5f17f0a0925b9863e28ad517/wGaaF9xwbCBNoZKC-VLEG.png)

相关链接：
- [https://huggingface.co/blog/ggml-org/anthropic-messages-api-in-llamacpp](https://huggingface.co/blog/ggml-org/anthropic-messages-api-in-llamacpp)

---

### [Anthropic 推出 Claude Code VS Code 扩展](https://code.claude.com/docs/en/vs-code) `#11`
> Claude AI 宣布 Claude Code 的 VS Code 扩展已上线。该扩展提供原生图形界面，支持在 IDE 中直接使用，用户可审查或自动接受编辑，使用 @-mentions 引用代码行，管理多对话，并通过快捷键 `Alt+K` 插入引用。支持三种权限模式，集成 Git 与终端，兼容 Anthropic 及第三方模型。需 VS Code 1.98.0 以上版本和账户。

Claude AI 宣布 Claude Code 的 VS Code 扩展正式上线，提供原生图形界面并集成至 IDE。用户可审查或自动接受 Claude 的编辑建议，支持 @-mentions 引用文件行范围，访问对话历史，并在多标签页中管理对话。扩展支持三种权限模式：Normal、Plan 和 Auto-accept，默认通过 `claudeCode.initialPermissionMode` 配置。集成 CLI 可通过终端访问，共享 `~/.claude/settings.json` 设置与对话历史，支持 `claude --resume` 续会及 `/ide` 连接外部终端。MCP 服务器通过 CLI 配置后可在扩展中使用。快捷键 `Option+K`（Mac）或 `Alt+K`（Win/Linux）插入 @-mention，多行输入用 `Shift+Enter`。命令菜单（`/`）支持附加文件、切换模型、查看用量等。支持 Git 操作，包括暂存、提交、PR 创建及多分支会话。需 VS Code 1.98.0+ 及 Anthropic 账户，兼容 Amazon Bedrock、Google Vertex AI、Microsoft Foundry。部分命令不支持，后台任务可见性受限。Spark 图标仅在打开文件时显示。扩展未出现时需重启或重载窗口。代码私密，不用于模型训练；自动编辑可修改配置文件，处理不信任代码时建议启用 Restricted Mode 或手动批准。无响应时检查网络、新建对话或使用 CLI 获取错误信息。

相关链接：
- [https://code.claude.com/docs/en/vs-code](https://code.claude.com/docs/en/vs-code)
- [https://x.com/claudeai/status/2013704053226717347](https://x.com/claudeai/status/2013704053226717347)

---

### [X 公司开源 For You 推荐算法](https://github.com/xai-org/x-algorithm) `#12`
> X公司工程团队开源了“为你推荐”信息流的新推荐算法，该算法基于xAI的Grok模型架构。Elon Musk表示算法尚不完善，通过每4周一次的代码更新和开发者说明实现透明改进。相关代码已发布于GitHub的x-algorithm仓库。

X 公司 Engineering 团队开源了驱动“为你推荐”信息流的新推荐算法，代码涵盖自然推文与广告推荐逻辑。该算法基于 xAI Grok 模型的 Transformer 架构。Elon Musk 表示算法当前“笨拙”，需改进，并称开源旨在提升透明度与性能，且为行业首创。新代码每 7 天首次开源，此后每 4 周更新一次，每次附带完整开发者说明。相关代码已发布于 GitHub 的 x-algorithm 仓库。

相关链接：
- [https://github.com/xai-org/x-algorithm](https://github.com/xai-org/x-algorithm)

---

### [Xiaomi MiMo API开放充值与定价](https://platform.xiaomimimo.com/) `#13`
> Xiaomi MiMo API 开放平台已开放充值功能，建议用户提前充值避免服务中断。国内输入0.7元/M tokens，输出2.1元/M tokens；海外输入0.1美元，输出0.3美元。新老用户均享免费额度，登录即可查看。

Xiaomi MiMo API 开放平台宣布充值功能上线，建议用户提前充值以保障服务连续性。MiMo-V2-Flash API 定价如下：国内输入 ¥0.7/M tokens（命中缓存 ¥0.07），输出 ¥2.1/M tokens；海外输入 $0.1/M tokens（命中缓存 $0.01），输出 $0.3/M tokens。平台已为新老用户发放专属免费额度，用户可登录账户查看。

相关链接：
- [https://platform.xiaomimimo.com/](https://platform.xiaomimimo.com/)

---

## 技术与洞察

### [BlinkDL发布RWKV-v8及ROSA架构](https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v8) `#14`
> BlinkDL 发布 RWKV-v8 及其 ROSA 变体，该架构结合 RNN 与 Transformer 特性，支持并行训练、线性时间复杂度和无限上下文。40K 参数模型在数字反转任务中精度达 99.8%，100 万参数模型处理 40 位加减法精度为 99%。

RWKV 项目发布 RWKV-v8 及其 ROSA（Recursive Operator Selective Attention）变体。RWKV 是一种结合 RNN 与 Transformer 特性的架构，具备线性时间复杂度、恒定空间占用、无需 KV-cache、支持无限上下文长度及免费句子嵌入。当前处于 RWKV-7 “Goose” 阶段，RWKV-8 ROSA 为后续演进版本。

测试显示，40K 参数模型在反转数字任务中精度达 99.8%；100 万参数模型在无思维链情况下处理 40 位加减法精度为 99%。训练损失方面，rosa_onlyemb、rosa_1bit、rosa_4bit 配置分别约为 0.65、0.4、0.25。社区已出现 rosa_soft、ROSA-Tuning、rosa-plus、RASP 等配套工具。

![](https://github.com/BlinkDL/RWKV-LM/raw/main/RWKV-8-ROSA.png)

![](https://github.com/BlinkDL/RWKV-LM/raw/main/RWKV-8-ROSA-260120.png)

相关链接：
- [https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v8](https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v8)
- [https://x.com/BlinkDL_AI/status/2013554628831650022](https://x.com/BlinkDL_AI/status/2013554628831650022)

---

### [Sam Altman与Elon Musk就ChatGPT安全问题展开公开争论](https://x.com/sama/status/2013703158459978076) `#15`
> Sam Altman 与 Elon Musk 就 ChatGPT 安全性公开争论。Musk 指控 ChatGPT 关联多起死亡案例，Altman 回应称平台有近 10 亿用户，部分处于脆弱状态，安全护栏需平衡保护与可用性。他同时批评特斯拉 Autopilot 安全性不足，并对 Musk 的指控回应称其将每条批评视为自白。

Sam Altman 与 Elon Musk 就 ChatGPT 安全性公开交锋。Musk 称 ChatGPT 关联 9 起死亡案例，其中 5 起涉自杀，受害者含青少年。Altman 回应称 ChatGPT 用户近 10 亿，部分用户心理脆弱，平台需平衡安全护栏与可用性，此问题“悲剧且复杂”。他提及特斯拉 Autopilot 已致超 50 人死，批评其安全性不足，并称 Musk 将指控视作自白。Altman 表示 OpenAI 负责处理相关问题，但对 Grok 决策不作评论。

相关链接：
- [https://x.com/sama/status/2013703158459978076](https://x.com/sama/status/2013703158459978076)
- [https://x.com/elonmusk/status/2013646828768518163](https://x.com/elonmusk/status/2013646828768518163)

---

### [DeepSeek 更新 FlashMLA 源码曝光 model1 架构](https://github.com/deepseek-ai/FlashMLA/blob/main/flash_mla/flash_mla_interface.py) `#16`
> DeepSeek 更新其 FlashMLA 源码，引入名为 model1 的新架构。该架构支持英伟达 Hopper 与下一代 SM100 架构，优化显存效率与推理精度，并已体现在 GitHub 仓库中。

DeepSeek 的 FlashMLA 源码库近期更新，出现名为 model1 的新模型引用。该库为支持 DeepSeek-V3 系列优化注意力核，现新增对英伟达 SM100 架构的支持，并引入统一 512 维度、值向量位置感知机制及疑似 Engram 和 DSA 技术，旨在提升显存效率与推理精度。代码中定义了 FlashMLASchedMeta 结构体，包含 b、s_q、h_q、page_block_size 和 h_k 五个 int 类型配置参数。GitHub 仓库更新发生于 2026 年 1 月 20 日前四天内。TestingCatalog News 指出 model1 或为 V3 系列提供动力，Zhipeng Huang 在 AAAI 2026 表示其或已临近，Linux.do 社区猜测可能预示 V4 版本。

![](https://pbs.twimg.com/media/G_G0FNiXcAArsUM?format=jpg&name=orig)

相关链接：
- [https://github.com/deepseek-ai/FlashMLA/blob/main/flash_mla/flash_mla_interface.py](https://github.com/deepseek-ai/FlashMLA/blob/main/flash_mla/flash_mla_interface.py)

---

## 行业动态

### [月之暗面估值达48亿美元并开启Kimi新模型API内测](https://mp.weixin.qq.com/s/1HCpiM28VVoHHgeLQoKanQ) `#17`
> 月之暗面完成5亿美元C轮融资，估值达48亿美元，现金超百亿元。公司创始人杨植麟表示，资金将用于研发下一代模型Kimi K3，强调其不仅是算力堆叠，更是架构与审美的综合演进。同时，Kimi开放平台开启视觉模型API内测，仅限认证企业用户申请。

月之暗面完成C轮融资5亿美元，估值达48亿美元，较2025年12月增长5亿。公司现金超百亿元。Kimi开放平台启动新视觉模型API内测，仅限认证企业用户申请。下一代模型Kimi K3将在K2基础上进行架构与数据演进，强调“品味”等非同质化特性。

相关链接：
- [https://mp.weixin.qq.com/s/1HCpiM28VVoHHgeLQoKanQ](https://mp.weixin.qq.com/s/1HCpiM28VVoHHgeLQoKanQ)

---

### [humans& 成立并获4.8亿美元融资](https://humansand.ai/) `#18`
> 初创公司 humans& 宣布成立，定位为以人为中心的前沿 AI 实验室。团队由 Anthropic、Google、xAI 及斯坦福学者组成，聚焦多智能体强化学习与用户理解。公司已完成 4.8 亿美元种子轮融资，估值 44.8 亿美元，投资方包括英伟达、贝索斯等。

初创公司 humans& 宣布成立，定位为“以人为中心”的前沿 AI 实验室，联合创始人 Eric Zelikman 表示其目标是让 AI 成为强化组织与社区的“连接纽带”，并提出“love is all you need”为核心理念。创始团队包括前 Anthropic 研究员 Andi Peng、Google 第七号员工 Georges Harik、前 xAI 成员 Eric Zelikman 与 Yuchen He，以及斯坦福教授 Noah Goodman。公司聚焦长程多智能体强化学习、记忆与用户理解，探索大规模模型训练与人机交互新范式。产品方向为促进人际协作的 AI 即时通讯应用，设想让 Chatbot 主动请求并存储用户信息。据《纽约时报》，成立三个月即完成 4.8 亿美元种子轮融资，估值 44.8 亿美元，投资方包括英伟达、Jeff Bezos、SV Angel、谷歌创投及 Emerson Collective。目前团队约 20 人，成员来自 OpenAI、Meta、MIT 等机构。

相关链接：
- [https://humansand.ai/](https://humansand.ai/)

---

## 前瞻与传闻

### [Sam Altman确认GPT-5.3存在并征集用户反馈](https://x.com/sama/status/2013404302400712757?s=20) `#19`
> Sam Altman 确认 GPT-5.3 存在，正征集用户改进建议。短期内不会推出 GPT-5.5，具体功能与发布时间尚未公布。

Sam Altman 确认 GPT-5.3 存在，并向用户征集功能反馈与改进建议。据转述信息，GPT-5.3 推出后短期内不会发布 GPT-5.5。目前尚未披露该版本的具体功能、发布时间或技术细节。

相关链接：
- [https://x.com/sama/status/2013404302400712757?s=20](https://x.com/sama/status/2013404302400712757?s=20)

---

### [Codex将新增多智能体协同功能](https://x.com/morqon/status/2013661492306948384) `#20`
> Codex 即将上线多智能体功能，可生成并协同其他智能体解决问题。该更新被部分网友称为重大升级。

Codex 即将上线多智能体功能，支持生成并协同其他智能体解决问题。据 Morgan 描述，该能力允许 Codex 动态创建智能体并协作执行任务。社交媒体有用户评论称此更新重大，并调侃需“牺牲一个器官”才能投入工作。

![](https://pbs.twimg.com/media/G_H1zPdXcAAAd7Z?format=jpg&name=orig)

相关链接：
- [https://x.com/morqon/status/2013661492306948384](https://x.com/morqon/status/2013661492306948384)

---

### [Tesla重启Dojo3项目转向太空AI计算](https://techcrunch.com/2026/01/20/elon-musk-says-teslas-restarted-dojo3-will-be-for-space-based-ai-compute) `#21`
> Elon Musk 宣布重启 Tesla 的 Dojo3 AI 芯片项目，定位为太空 AI 计算“moonshot”计划。该项目原为地面自动驾驶训练，现转向利用 Starship 发射计算卫星群。AI5 芯片由 TSMC 制造，AI6 芯片将由三星代工。Tesla 正重建团队，招募工程师参与芯片研发。

Elon Musk 宣布重启 Tesla 前期搁置的 Dojo3 AI 芯片项目，定位为“太空 AI 计算”（space-based AI compute）的“moonshot”计划。该项目不再用于地面自动驾驶训练，而是支持 Starship 发射的计算卫星群，以实现持续太阳能供电的数据中心。Musk 表示 AI5 芯片设计进展顺利，由 TSMC 制造，用于 FSD 和 Optimus；AI6 芯片将由三星代工，价值 165 亿美元，2025 年夏季签约。Tesla 正重建此前解散的 Dojo 团队，Musk 在 X 上招募工程师，邮箱为 AI_Chips@Tesla.com。Axios 报道称，Musk 计划利用 SpaceX IPO 资助太空愿景，而 OpenAI CEO Sam Altman 也对轨道数据中心感兴趣，但 Musk 拥有运载工具优势。

相关链接：
- [https://techcrunch.com/2026/01/20/elon-musk-says-teslas-restarted-dojo3-will-be-for-space-based-ai-compute](https://techcrunch.com/2026/01/20/elon-musk-says-teslas-restarted-dojo3-will-be-for-space-based-ai-compute)

---

**提示**：内容由AI辅助创作，可能存在**幻觉**和**错误**。