2026-05-10 · Markdown

AI 早报 2026-05-10

视频版哔哩哔哩YouTube

概览

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻


模型发布

百度宣布文心 5.1 模型正式上线 #1

百度宣布文心5.1大模型正式上线,用户可登录官网或星河社区Playground体验。该模型总参数较前代压缩至三分之一,预训练成本仅为同规模百分之六。现正陆续上架数十个创作Agent平台。

百度宣布文心 5.1 大模型已于即日起正式上线,用户可登录官网或通过星河社区 Playground 进行体验。该模型基于文心 5.0 进行架构创新,总参数量压缩至原版的约 1/3,激活参数量压缩至约 1/2,其预训练成本仅为业界同规模模型的约 6%。在模型能力上,文心 5.1 在 Arena 搜索榜上以 1223 分取得全球第四、国内第一的成绩;在 GPQA 和 MMLU-Pro 评测中,该模型的世界知识与创意写作能力亦表现领先,创意写作能力在内部评测中接近 Gemini 3.1 Pro。技术方面,研发团队引入了多维度弹性预训练技术与 Once-for-All 弹性训练框架,并通过分离式全异步强化学习架构、FP8 训推一致性优化及资源异构弹性调度来支持高效稳定的训练,同时采用以多教师在线策略蒸馏为核心的后训练管线,以并行专家训练与统一能力融合解决多目标优化冲突。此外,文心 5.1 在创意写作领域获得了创作类企业与专业作家的广泛赞誉,并将陆续上线 ISEKAI ZERO 等数十个创作类 Agent 平台。

相关链接:


HiDream-ai 开源 HiDream-O1-Image 图像生成模型 #2

HiDream-ai团队开源了8B参数的图像生成模型HiDream-O1-Image。该模型基于统一Transformer架构,无需外部VAE即可原生生成2048分辨率图像。

HiDream-ai 团队开源了其原生统一图像生成基础模型 HiDream-O1-Image(代号 Peanut),该模型包含未蒸馏(full)和蒸馏 Dev 两个变体,并同步发布了推理驱动的 Prompt Agent。HiDream-O1-Image 参数量为 8B,基于像素级统一 Transformer(UiT),无需外部 VAE 或分离式文本编码器,直接在单一共享 Token 空间中编码原始像素、文本及任务条件,支持文生图、图像编辑、主体驱动个性化等任务,原生分辨率可达 2048×2048。在 Artificial Analysis Text to Image Arena 中,该模型首次上榜即位列第 8,官方称其已成为新晋领先的开放权重文生图模型。该项目代码库及模型权重均已以 MIT 许可证发布在 GitHub 与 HuggingFace。

相关链接:


开发生态

OpenRouter 推出 Pareto Code 实验性编码路由 #3

OpenRouter推出了实验性编码路由Pareto Code。该路由会根据ArtificialAnalysis排名,自动把任务分配给满足分数要求且成本最低的模型,并提供了提速的Nitro版本。

OpenRouter近日推出实验性编码路由Pareto Code。开发者设置min_coding_score参数后,系统会依据ArtificialAnalysis排名,自动将任务定向至满足分数要求且成本最低的模型。该路由设3个质量频带,共含13个模型,最高支持2M上下文;针对低延迟场景,另提供牺牲多样性换取速度的Nitro变体。OpenRouter称,因模型快速迭代,数月内各频带成本降10至100倍,该产品旨在顺应此趋势。该功能现已开放试用。

相关链接:


技术与洞察

OpenAI 公开内部 Codex 安全运行实践 #4

OpenAI近期分享了一篇关于其如何在内部安全运行Codex的技术实践文章,重点介绍了沙箱执行边界、审批策略、自动审核模式、网络策略、身份验证绑定、命令规则以及Agent原生遥测等控制措施。

OpenAI近期发文分享其内部安全部署编程Agent Codex的技术实践。该文章显示,OpenAI为Codex设定了清晰的技术边界,通过沙箱限定可写路径与网络访问,结合审批机制区分低风险与高风险操作,并启用Auto-review功能自动批准常规请求以降低人工中断频率;网络策略默认不开放任意出站,仅允许经批准的域并通过缓存进行网络搜索,同时将CLI和MCP OAuth凭据存入操作系统安全密钥环,强制通过ChatGPT登录并绑定至企业工作区以集中管控。在遥测方面,Codex支持通过OpenTelemetry导出用户提示、工具审批决策、MCP服务器使用和网络代理允许/拒绝等事件日志,并已集成至OpenAI合规平台,帮助安全团队理解Agent行为意图。目前相关配置方案与合规API已面向企业及教育用户开放。

相关链接:


Perplexity 公开内部 Agent Skills 设计维护指南 #5

Perplexity 发文介绍其内部 Agent Skills 的设计与维护指南。其指出:构建 Skill 需先编写评估,抓住描述中的触发词,用层级组织复杂知识,再通过记录失败案例的 gotchas 飞轮持续维护。

Perplexity Research近期公开了其内部使用的Agent Skills设计、优化与维护指南,这份源自Perplexity Computer产品实践的文档旨在将相关经验开放给社区。根据指南,Agent Skill是一个由SKILL.md、scripts/、references/等文件组成的多级目录,依靠以“Load when...”开头的描述进行隐式路由匹配,并通过索引、加载、运行时三层渐进式上下文机制实现按需调用。开发Skill的理念与传统代码截然不同,官方提出“Skills之禅”等对比,并系统讲解了何时需要Skill、如何从编写评估和描述入手,利用层级结构和迭代来构建Skill,以及如何借助“gotchas飞轮”和跨模型评估套件进行维护。Perplexity还强调每个Skill都会对全局上下文构成成本,新增Skill可能无意间干扰已有Skill的正确路由。

相关链接:


行业动态

Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 #6

Nous Research团队宣布,旗下Hermes Agent在OpenRouter平台全球Token排名中超越OpenClaw登顶,拿下所有AI应用第一名。

Nous Research通过官方社交账号宣布,其旗下Hermes Agent已攀升至OpenRouter平台的全球token排名首位。据该团队成员Teknium进一步表示,这意味着Hermes Agent在该平台所有AI应用中排名全球第一。团队借此向近1000名贡献者、支持者及用户表达感谢。同时,Teknium向社区公开征询意见,询问用户对后续新功能或发展方向的期待。

相关链接:


消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 #7

据报道,Anthropic与云服务商Akamai签署了价值十八亿美元、为期七年的云基础设施服务合同,以满足其日益增长的算力需求。受此大单提振,Akamai股价连续大涨。

据知情人士透露,人工智能公司Anthropic已与云服务提供商Akamai Technologies签署一项总额18亿美元、为期七年的计算服务合同,旨在满足其AI软件日益增长的需求。Akamai在本周四发布2026年第一季度财报时披露,一家“领先的前沿模型提供商”已向其云基础设施服务(CIS)承诺18亿美元为期七年的采购额,但未指名合作方;随后有媒体报道指该客户为Anthropic,而双方均未予置评。

相关链接:


前瞻与传闻

报道称字节跳动今年 AI 基建支出超两千亿 #8

据报道,字节跳动今年AI基础设施支出将超2000亿元,较原计划至少增加25%,更多预算投向国产AI芯片。

近日,据《南华早报》援引知情人士报道,字节跳动今年在AI基础设施方面的支出将超过2000亿元人民币,较去年底的1600亿元计划至少增加25%,增资原因包括AI投入加大和存储芯片成本上涨,且更大比例的预算将分配给国产AI芯片。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误