AI 早报 2026-01-19
概览
要闻
- Cerebras携手OpenAI推AI推理服务 ↗
#1
开发生态
- Warp CLI 新增对多款CLI coding agents 的原生支持 ↗
#2
技术与洞察
- Ramp Labs 将 Claude Code 接入《过山车大亨 2》 ↗
#3
要闻
Cerebras携手OpenAI推AI推理服务 #1
Cerebras与OpenAI合作推出AI推理服务,其CS-3超算平台实现每秒3000词生成,速度为传统GPU的15倍。该平台支持GPT-OSS-120B、Llama 3.3/4、Qwen 3及GLM-4.7等主流大模型,其中Qwen 3达每秒1400词,Llama 4更高达2500词。此举大幅降低算力成本,Meta、Perplexity等已接入服务。Cerebras正加速布局,已在美国和欧洲建成六个数据中心,预计提供超4000万词/秒的全球吞吐能力。
Cerebras 与 OpenAI 达成战略合作,推出 AI 推理服务。其 CS-3 超算系统支持 GPT-OSS-120B 模型,生成速度达每秒 3000 tokens,为传统 GPU 的 15 倍。平台还兼容 Llama 3.3、Llama 4、Qwen 3 及 GLM-4.7 等主流大模型,其中 Qwen 3(235B 参数)生成速度达每秒 1400 tokens,Llama 4 Maverick 达每秒 2500 tokens。该方案显著降低算力成本,Meta、Perplexity 与 DeepLearning.AI 已接入服务。Cerebras 在美欧部署六个数据中心,预计提供超 4000 万 tokens/秒 的全球吞吐能力。

相关链接:
开发生态
Warp CLI 新增对多款CLI coding agents 的原生支持 #2
Warp CLI新增对Claude Code、Codex等AI编码助手的一级支持,集成语音、图像上传和代码浏览功能,提升开发体验。
Warp CLI 新增对 Claude Code、Codex、Amp、Gemini 和 Droid 等 coding agents 的一级支持,集成语音转录、图像附加、文件浏览与代码审查功能。部分用户认为这些能力多为 Warp 原有功能的整合,称其为“套壳”,但认可其合理性。另有建议称可加入 Kanban 管理 agent 进程。

相关链接:
技术与洞察
Ramp Labs 将 Claude Code 接入《过山车大亨 2》 #3
Ramp Labs 将 AI 智能体 Claude Code 接入《过山车大亨 2》,通过终端实时分析财务、设备与游客数据,并自动生成管理任务。团队基于 OpenRCT2 开发,使用 rctctl 工具与 RPC 层实现控制,AI 通过 ASCII 地图理解环境,项目耗时约 40 小时完成。
Ramp Labs 将 AI 智能体 Claude Code 集成至《过山车大亨 2》,通过开源项目 OpenRCT2 实现。Claude Code 可实时分析上百个数据点,如财务、设备状态和游客投诉,并在终端窗口中生成任务清单,例如增设摊位、派遣机械师或调整票价。团队开发了名为 rctctl 的命令行工具,其接口模仿 kubectl,支持通过 RPC 层控制游戏状态。AI 无法直接读取画面,需请求 ASCII 字符地图(如 R 表轨道,P 表人行道)。项目包含新菜单选项、终端窗口、rctctl 工具及 RPC 层,耗时约 40 小时完成,采用“氛围编码”方式,结合多模型协作开发。
相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。