AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:成本优化×
6月28日
20:24
20:24Decoder@Matthias Bastian
精选
Coinbase CEO Brian Armstrong将公司系统切换至中国AI模型GLM 5.2和Kimi 2.7。自动路由系统根据任务和价格选择最佳模型,缓存命中率从5%提升至60%。尽管token使用量持续增长,Coinbase的AI支出已减半。此举凸显西方AI实验室正面临定价压力测试。
行业CoinbaseGLM 5.2Kimi 2.7成本优化定价压力

推荐理由:Coinbase用GLM 5.2和Kimi 2.7替换了西方模型,成本砍半,缓存命中率翻了12倍。想知道为什么中国模型更便宜?
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
14:36
14:36IT之家(博客/媒体)
哈佛大学与Perplexity联合研究,基于10000组真实生产数据,对比了对话式搜索与AI智能体(Perplexity Computer)的效率。结果显示,智能体在自主性上提升48倍,任务时间缩短87%,总成本下降94%,且质量未降反升(不满率1.3% vs 2.9%)。智能体虽单次模型成本更高(4-10美元 vs 0.05美元),但大幅降低了人力边际成本(从2.05美元降至0.16美元)。研究建议,短小单步任务适合搜索,多步骤、需调用工具的工作应交给智能体。
行业AI智能体效率提升成本优化Perplexity人机协作

推荐理由:这份研究用真实数据证明了AI智能体在复杂任务中的效率优势,做自动化流程或知识管理的团队可以直接参考成本收益模型,评估是否值得投入。
原文
6月7日
18:57
18:57Decoder@Jonathan Kemper
精选72°
Perplexity 推出了名为“Search as Code”的新架构,摒弃了传统的固定搜索 API,允许 AI 模型用 Python 编写自己的搜索例程。该系统在沙盒环境中处理过滤和去重,在关键基准测试上超越了 OpenAI 和 Anthropic,同时将 token 成本降低了高达 85%。这一创新使 AI 搜索更灵活、高效,尤其适合需要定制化搜索逻辑的开发者。
AI产品Perplexity搜索即代码AI 搜索成本优化沙盒执行

推荐理由:Perplexity 的“Search as Code”解决了固定 API 的僵化问题,做搜索增强或 AI 应用的团队可以大幅降低 token 成本并提升性能,值得直接尝试。
原文
6月6日
15:43
15:43Pandaily@contact@pandaily.com (Pandaily)
精选83°
普林斯顿大学语言与智能实验室(PLI)发布了一篇关于 Goedel-Architect 的突破性论文,这是一个用于形式定理证明的智能体框架。该框架基于 DeepSeek V4 模型,在多个基准测试中取得了最先进的结果,同时成本仅为现有系统的 1/500。Goedel-Architect 通过将推理任务分解为可管理的子任务,并利用 DeepSeek V4 的高效推理能力,显著降低了形式验证的计算开销。这一成果有望推动数学证明和软件验证领域的自动化进程,使形式化方法更易于被学术界和工业界采用。
论文形式定理证明DeepSeek V4智能体框架成本优化普林斯顿大学

推荐理由:形式定理证明的成本一直是阻碍其大规模应用的瓶颈,Goedel-Architect 用 DeepSeek V4 把成本砍到原来的 1/500,做数学验证和软件安全的团队可以直接关注这个新范式。
原文
精选全部日报登录