全部 AI 动态 · AI 热点

6月28日

05:20

05:20

Aravind Srinivas@AravSrinivas

推文预测未来每家企业都会构建自身的模型-测试-沙箱-评估飞轮，并优化每瓦特token价值。核心驱动力是企业对其领域、客户和工作流拥有独特的隐性知识。该观点获得630个赞和35339次浏览。

行业 Perplexity 企业AI 模型评估飞轮 token效率隐性知识

推荐理由：Perplexity CEO预测企业AI的未来是定制评估飞轮和能耗优化，看看这个趋势分析

6月26日

10:19

10:19

GitHub Blog@Natalie Guevara

精选

GitHub Copilot agentic harness 在多项基准测试中展现优异性能，同时实现领先的 token 效率。该框架支持超过 20 种不同模型，提供灵活的模型选择。评测覆盖多种任务类型，验证了其通用性。

AI产品 GitHub Copilot agentic harness token效率编程助手基准测试

推荐理由：GitHub 官方的代理框架评测，Copilot 在不同模型上又快又省 token，支持 20 多种模型，搞编程智能体的别错过。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

13:50

13:50

@hebbia@hebbia

精选73°

Hebbia CTO 指出 Claude Opus 4.8 在金融工作流中实现了更强的引用准确性。相比前代，它在处理复杂金融文档时 token 效率显著提升。新模型适用于需要高精度引用的财务分析场景。

AI模型 Claude Opus 4.8 Hebbia 金融引用准确率 token效率

推荐理由：Hebbia 的 CTO 亲测说 Claude Opus 4.8 在金融任务上引用更准、省 token，做财报分析的团队可以试试。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？