2026-05-10 · Markdown

AI 早报 2026-05-10

视频版：哔哩哔哩｜ YouTube

概览

模型发布

百度宣布文心 5.1 模型正式上线 ↗ #1
HiDream-ai 开源 HiDream-O1-Image 图像生成模型 ↗ #2

开发生态

OpenRouter 推出 Pareto Code 实验性编码路由 ↗ #3

技术与洞察

OpenAI 公开内部 Codex 安全运行实践 ↗ #4
Perplexity 公开内部 Agent Skills 设计维护指南 ↗ #5

行业动态

Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 ↗ #6
消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 ↗ #7

前瞻与传闻

报道称字节跳动今年 AI 基建支出超两千亿 ↗ #8

模型发布

百度宣布文心 5.1 模型正式上线 `#1`

百度宣布文心5.1大模型正式上线，用户可登录官网或星河社区Playground体验。该模型总参数较前代压缩至三分之一，预训练成本仅为同规模百分之六。现正陆续上架数十个创作Agent平台。

百度宣布文心 5.1 大模型已于即日起正式上线，用户可登录官网或通过星河社区 Playground 进行体验。该模型基于文心 5.0 进行架构创新，总参数量压缩至原版的约 1/3，激活参数量压缩至约 1/2，其预训练成本仅为业界同规模模型的约 6%。在模型能力上，文心 5.1 在 Arena 搜索榜上以 1223 分取得全球第四、国内第一的成绩；在 GPQA 和 MMLU-Pro 评测中，该模型的世界知识与创意写作能力亦表现领先，创意写作能力在内部评测中接近 Gemini 3.1 Pro。技术方面，研发团队引入了多维度弹性预训练技术与 Once-for-All 弹性训练框架，并通过分离式全异步强化学习架构、FP8 训推一致性优化及资源异构弹性调度来支持高效稳定的训练，同时采用以多教师在线策略蒸馏为核心的后训练管线，以并行专家训练与统一能力融合解决多目标优化冲突。此外，文心 5.1 在创意写作领域获得了创作类企业与专业作家的广泛赞誉，并将陆续上线 ISEKAI ZERO 等数十个创作类 Agent 平台。

相关链接：

https://yiyan.baidu.com/blog/zh/posts/ernie-5.1-0508-release/

HiDream-ai 开源 HiDream-O1-Image 图像生成模型 `#2`

HiDream-ai团队开源了8B参数的图像生成模型HiDream-O1-Image。该模型基于统一Transformer架构，无需外部VAE即可原生生成2048分辨率图像。

HiDream-ai 团队开源了其原生统一图像生成基础模型 HiDream-O1-Image（代号 Peanut），该模型包含未蒸馏（full）和蒸馏 Dev 两个变体，并同步发布了推理驱动的 Prompt Agent。HiDream-O1-Image 参数量为 8B，基于像素级统一 Transformer（UiT），无需外部 VAE 或分离式文本编码器，直接在单一共享 Token 空间中编码原始像素、文本及任务条件，支持文生图、图像编辑、主体驱动个性化等任务，原生分辨率可达 2048×2048。在 Artificial Analysis Text to Image Arena 中，该模型首次上榜即位列第 8，官方称其已成为新晋领先的开放权重文生图模型。该项目代码库及模型权重均已以 MIT 许可证发布在 GitHub 与 HuggingFace。

相关链接：

开发生态

OpenRouter 推出 Pareto Code 实验性编码路由 `#3`

OpenRouter推出了实验性编码路由Pareto Code。该路由会根据ArtificialAnalysis排名，自动把任务分配给满足分数要求且成本最低的模型，并提供了提速的Nitro版本。

OpenRouter近日推出实验性编码路由Pareto Code。开发者设置min_coding_score参数后，系统会依据ArtificialAnalysis排名，自动将任务定向至满足分数要求且成本最低的模型。该路由设3个质量频带，共含13个模型，最高支持2M上下文；针对低延迟场景，另提供牺牲多样性换取速度的Nitro变体。OpenRouter称，因模型快速迭代，数月内各频带成本降10至100倍，该产品旨在顺应此趋势。该功能现已开放试用。

相关链接：

技术与洞察

OpenAI 公开内部 Codex 安全运行实践 `#4`

OpenAI近期分享了一篇关于其如何在内部安全运行Codex的技术实践文章，重点介绍了沙箱执行边界、审批策略、自动审核模式、网络策略、身份验证绑定、命令规则以及Agent原生遥测等控制措施。

OpenAI近期发文分享其内部安全部署编程Agent Codex的技术实践。该文章显示，OpenAI为Codex设定了清晰的技术边界，通过沙箱限定可写路径与网络访问，结合审批机制区分低风险与高风险操作，并启用Auto-review功能自动批准常规请求以降低人工中断频率；网络策略默认不开放任意出站，仅允许经批准的域并通过缓存进行网络搜索，同时将CLI和MCP OAuth凭据存入操作系统安全密钥环，强制通过ChatGPT登录并绑定至企业工作区以集中管控。在遥测方面，Codex支持通过OpenTelemetry导出用户提示、工具审批决策、MCP服务器使用和网络代理允许/拒绝等事件日志，并已集成至OpenAI合规平台，帮助安全团队理解Agent行为意图。目前相关配置方案与合规API已面向企业及教育用户开放。

相关链接：

https://openai.com/index/running-codex-safely/

Perplexity 公开内部 Agent Skills 设计维护指南 `#5`

Perplexity 发文介绍其内部 Agent Skills 的设计与维护指南。其指出：构建 Skill 需先编写评估，抓住描述中的触发词，用层级组织复杂知识，再通过记录失败案例的 gotchas 飞轮持续维护。

Perplexity Research近期公开了其内部使用的Agent Skills设计、优化与维护指南，这份源自Perplexity Computer产品实践的文档旨在将相关经验开放给社区。根据指南，Agent Skill是一个由SKILL.md、scripts/、references/等文件组成的多级目录，依靠以“Load when...”开头的描述进行隐式路由匹配，并通过索引、加载、运行时三层渐进式上下文机制实现按需调用。开发Skill的理念与传统代码截然不同，官方提出“Skills之禅”等对比，并系统讲解了何时需要Skill、如何从编写评估和描述入手，利用层级结构和迭代来构建Skill，以及如何借助“gotchas飞轮”和跨模型评估套件进行维护。Perplexity还强调每个Skill都会对全局上下文构成成本，新增Skill可能无意间干扰已有Skill的正确路由。

相关链接：

https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

行业动态

Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 `#6`

Nous Research团队宣布，旗下Hermes Agent在OpenRouter平台全球Token排名中超越OpenClaw登顶，拿下所有AI应用第一名。

Nous Research通过官方社交账号宣布，其旗下Hermes Agent已攀升至OpenRouter平台的全球token排名首位。据该团队成员Teknium进一步表示，这意味着Hermes Agent在该平台所有AI应用中排名全球第一。团队借此向近1000名贡献者、支持者及用户表达感谢。同时，Teknium向社区公开征询意见，询问用户对后续新功能或发展方向的期待。

相关链接：

https://x.com/NousResearch/status/2052904761087729897

消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 `#7`

据报道，Anthropic与云服务商Akamai签署了价值十八亿美元、为期七年的云基础设施服务合同，以满足其日益增长的算力需求。受此大单提振，Akamai股价连续大涨。

据知情人士透露，人工智能公司Anthropic已与云服务提供商Akamai Technologies签署一项总额18亿美元、为期七年的计算服务合同，旨在满足其AI软件日益增长的需求。Akamai在本周四发布2026年第一季度财报时披露，一家“领先的前沿模型提供商”已向其云基础设施服务（CIS）承诺18亿美元为期七年的采购额，但未指名合作方；随后有媒体报道指该客户为Anthropic，而双方均未予置评。

相关链接：

前瞻与传闻

报道称字节跳动今年 AI 基建支出超两千亿 `#8`

据报道，字节跳动今年AI基础设施支出将超2000亿元，较原计划至少增加25%，更多预算投向国产AI芯片。

近日，据《南华早报》援引知情人士报道，字节跳动今年在AI基础设施方面的支出将超过2000亿元人民币，较去年底的1600亿元计划至少增加25%，增资原因包括AI投入加大和存储芯片成本上涨，且更大比例的预算将分配给国产AI芯片。

相关链接：

https://www.scmp.com/tech/article/3352736/tiktok-makes-record-us25b-investment-expand-digital-infrastructure-thailand

提示：内容由AI辅助创作，可能存在幻觉和错误。

AI 早报 2026-05-10

概览

模型发布

开发生态

技术与洞察

行业动态

前瞻与传闻

模型发布

百度宣布文心 5.1 模型正式上线 #1

HiDream-ai 开源 HiDream-O1-Image 图像生成模型 #2

开发生态

OpenRouter 推出 Pareto Code 实验性编码路由 #3

技术与洞察

OpenAI 公开内部 Codex 安全运行实践 #4

Perplexity 公开内部 Agent Skills 设计维护指南 #5

行业动态

Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 #6

消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 #7

前瞻与传闻

报道称字节跳动今年 AI 基建支出超两千亿 #8

百度宣布文心 5.1 模型正式上线 `#1`

HiDream-ai 开源 HiDream-O1-Image 图像生成模型 `#2`

OpenRouter 推出 Pareto Code 实验性编码路由 `#3`

OpenAI 公开内部 Codex 安全运行实践 `#4`

Perplexity 公开内部 Agent Skills 设计维护指南 `#5`

Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 `#6`

消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 `#7`

报道称字节跳动今年 AI 基建支出超两千亿 `#8`