精选 AI 资讯 · AI 热点

6月18日

08:15

08:15Simon Willison’s Weblog（博客/媒体）

精选73°

中国AI实验室Z.ai于6月16日开源GLM-5.2，采用MIT许可证。该模型753B参数、40激活参数（MoE），上下文窗口从GLM-5.1的20万提升至100万。在Artificial Analysis Intelligence Index v4.1上以51分领先MiniMax-M3（44）和DeepSeek V4 Pro（44）。在Code Arena WebDev前端编码排行榜上排名第二，仅次于Claude Fable 5。OpenRouter上输入价格$1.40/百万token，输出$4.40/百万token。

AI模型 GLM-5.2 Z.ai OpenRouter 开源模型编程助手

推荐理由：Z.ai开源了GLM-5.2，纯文本模型在智能和编码基准上超过DeepSeek V4和Kimi K2.6，价格只有GPT-5.5的五分之一。

6月17日

03:05

03:05

OpenRouter@OpenRouterAI

精选

智谱AI的GLM-5.2模型已在OpenRouter平台上线。该模型拥有100万token的上下文窗口。它专为长周期、混乱的编码代理任务设计，能保持可靠性。

AI模型 GLM-5.2 Z.ai OpenRouter 超长上下文智能体

推荐理由：GLM-5.2在OpenRouter上架了，百万级上下文处理复杂编码任务，适合做长周期智能体。

6月16日

15:49

15:49IT之家（博客/媒体）

精选

OpenRouter于6月14日发布Fusion API复合AI模型，通过并行调用多个模型并汇总结果实现协同回答。基准测试中，Claude Opus 4.8+GPT-5.5+Gemini 3.1 Pro组合得分68.3%，超过Claude Fable 5的65.3%。而Gemini 3 Flash+Kimi K2.6+DeepSeek V4 Pro组合以约一半成本实现64.7%的得分，差距不到1%。该服务分为并行请求、审查模型分析、调用模型生成最终答复三个步骤。

AI模型 OpenRouter Fusion Claude Fable 5 多模型协同推理模型

推荐理由：OpenRouter用多个便宜模型拼出顶级效果，成本砍半但性能追上Claude Fable 5，预算有限又想用好模型可以试试。

14:14

14:14

kimmonismus@kimmonismus

精选

OpenRouter 推出 Fusion 功能，这是一种服务端“模型面板”。它可将用户提示并行发送给多个模型，并允许它们使用网络搜索和 Bash 工具。Fusion 通过裁判比较各模型答案，由合成器生成最终响应。成本可能低于依赖单一昂贵前沿模型。官方称其在 Perplexity 的 DRACO 深度研究基准上击败了前沿模型。

AI产品 OpenRouter Fusion Perplexity DRACO基准多模型协作

推荐理由：OpenRouter 出了个新玩法 Fusion，多个模型一起干活还能用工具，比单用最贵的模型还省钱，实测在 DRACO 基准上比前沿模型强。

6月15日

12:35

12:35

Jerry Liu@jerryjliu0

精选

OpenRouter 推出 Fusion API，这是一种复合模型，能以一半的价格达到 Fable 级别的智能。该 API 通过混合多个模型来优化成本与准确率，使得非前沿实验室的公司也能利用这一优势。例如，在发票对账等特定任务中，通过混合模型调优可大幅降低成本和提升可靠性。

AI产品 OpenRouter Fusion API Fable 模型混合成本优化

推荐理由：混合模型做到半价高智能

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

00:44

00:44

OpenRouter@OpenRouterAI

精选

OpenRouter 宣布其平台支持智能体仅在需要时调用前沿推理模型，其余操作使用低成本小模型，从而大幅降低运行成本。用户只需在工具列表中添加一个条目，即可开始迁移至更经济的定价曲线。这一功能解决了智能体长期运行中推理成本高昂的问题，尤其适合需要频繁调用 AI 的开发者或团队。目前该功能已上线，用户可通过 OpenRouter 文档中的指南快速上手。

AI产品智能体推理模型成本优化 OpenRouter API/平台

推荐理由：做 AI 智能体开发的团队终于不用为每次推理都付高价了——OpenRouter 让前沿模型只在必要时出场，其余用低成本小模型，建议直接试试这个配置，能省不少钱。

00:42

00:42

OpenRouter@OpenRouterAI

精选

OpenRouter 指出，在决策点切换模型能有效减少自偏好偏差，即模型倾向于固守自身失败的推理轨迹。该观点引用 Panickssery 等人 2024 年的论文，强调切换模型可打破这种锚定效应，提升决策质量。这对于需要多模型协作或复杂推理的 AI 应用场景具有重要参考价值。

AI模型 OpenRouter 自偏好偏差模型切换推理优化决策点

推荐理由：做多模型编排或推理链优化的开发者，这个发现能帮你减少模型自我锚定带来的错误，值得在 pipeline 里试试切换策略。

6月8日

13:30

13:30

Jerry Liu@jerryjliu0

精选

Jerry Liu（LlamaIndex 创始人）认为，AI 创业公司将在“模型路由即服务”领域积累大量价值，这不仅是 OpenRouter 这样的通用路由，还包括垂直化的智能体和基础设施。他以文档基础设施（解析、提取、搜索）和网络搜索（Exa/Parallel）为例，说明在准确性与成本的帕累托曲线上找到最佳点既重要又困难。Brian Armstrong 补充说，未来 80% 的工作负载将运行在便宜 99% 的模型上，只有 20% 需要最新高端模型，而 Coinbase 已通过路由提示词到更便宜的模型来保持成本稳定。这揭示了模型路由作为降低 AI 应用成本、提升效率的关键基础设施，对开发者和创业公司是巨大机会。

行业模型路由 AI 基础设施成本优化智能体 OpenRouter

推荐理由：模型路由是 AI 应用降本增效的关键，做 AI 产品、智能体或基础设施的团队值得关注——它可能成为下一个像 API 网关一样的基础设施层。

6月7日

14:46

14:46

OpenRouter@OpenRouterAI

精选

OpenRouter 在定价页面新增了实时缓存命中率和历史流量数据，帮助用户了解不同模型提供商的实际缓存效果和有效价格。以 Opus 4.8 为例，用户现在可以直观对比各提供商的缓存效率，从而优化成本。这一功能解决了开发者难以评估缓存实际收益的痛点，让模型选择更透明。

AI产品 OpenRouter 缓存命中率有效价格模型选择成本优化

推荐理由：做 AI 应用开发的团队终于能看清缓存的实际效果了——OpenRouter 把缓存命中率和有效价格摆上台面，选模型时不再靠猜，建议直接去 Pricing 页对比一下。

6月2日

10:16

10:16

OpenRouter@OpenRouterAI

精选

OpenRouter 发布视频教程，展示如何利用其新的可堆叠 Guardrail 架构构建一个每周预算上限为 1000 美元、带有模型黑名单和自定义数据保留策略的 AI 智能体。该架构集中管理 AI 流量的安全与治理，支持预算限制、零数据保留、模型与提供商限制、提示注入防御以及数据丢失防护/敏感信息检测。开发者可以将这些规则分层组合，实现灵活控制。这为需要成本控制和数据安全的团队提供了实用的企业级解决方案。

AI产品智能体成本控制数据安全 OpenRouter Guardrail

推荐理由：OpenRouter 的 Guardrail 架构解决了 AI 智能体成本失控和数据安全两大痛点，做 AI 应用开发或企业部署的团队可以直接参考教程实现预算限制和合规管控，值得点开学习。

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月19日

13:13

13:13

OpenRouter@OpenRouterAI

精选76°

OpenRouter 推出了一套用于构建长周期智能体的基础原语，旨在解决 AI 智能体在长时间任务中的可靠性和可扩展性问题。这些原语提供了模块化的构建块，帮助开发者更高效地设计能够持续运行数小时甚至数天的智能体。该发布引起了社区关注，已有近千次浏览，表明开发者对长周期智能体开发工具的需求强烈。

AI产品智能体长周期任务 OpenRouter 开发工具自动化

推荐理由：OpenRouter 这套原语解决了长周期智能体开发中的核心痛点，做复杂自动化任务的团队可以直接参考，省去自己造轮子的时间。