21:12Decoder@Maximilian SchreinerOpenAI部署部门DeployCo负责人Arnaud Fournier在访谈中介绍,他们通过派遣自有工程师将AI深度嵌入大企业。他提到Codex产品经历了快速增长,客户反馈直接回馈到模型开发中。他还指出,AI智能的价格已大幅下降,并讨论了企业部署AI的投资回报率问题。行业OpenAICodexDeployCo企业AI部署AI成本10 个信源在谈推荐理由:OpenAI部署老大亲口讲Codex怎么涨、AI怎么降价,还聊了企业落地的实际回报,挺干货。原文
10:43pandaily@contact@pandaily.com (Pandaily)微软因AI推理token成本飙升,宣布Copilot Cowork产品改为基于使用量的定价模式。为控制成本,微软选择整合开源模型DeepSeek V4作为替代方案。这一决策反映了大型企业在大规模AI部署中面临的经济压力,以及开源模型在成本效率上的竞争力。DeepSeek V4的参数量与性能表现接近GPT-4级别,但推理成本可降低80%以上。AI产品微软DeepSeek V4定价策略开源模型AI成本推荐理由:微软的Copilot因为Token太贵改用DeepSeek了,以后按用量计费,用多少付多少。想省钱的话可以关注这个开源模型。原文
06:55ollama@ollamaOllama 转发了 Aaron Levie 的观点,指出开放权重模型在特定任务上已取得 SOTA 结果,并在编码等部分领域接近前沿水平。Levie 强调,开放权重模型与前沿模型之间的边际差距若能保持而非扩大,将创造更多 AI 应用价值。他还提到,使用更便宜或针对特定任务微调的开放模型可优化成本,同时前沿模型仍可用于规划、编排等复杂工作。行业Ollamaopen weights开源模型AI成本具体任务微调推荐理由:Ollama 分享了 Levie 对开放权重模型的乐观看法:这些模型成本更低、表现接近前沿,还能针对性微调,对 AI 应用层是大利好。原文
21:15Decoder@Matthias Bastian微软CEO萨提亚·纳德拉警告不要对所有问题都使用最强AI模型,称前沿模型不应浪费在日常任务上。他指出生产力提升的边际成本必须与token成本匹配。纳德拉承认自己也是token消耗狂,形容这会上瘾。行业微软Satya Nadellatoken-maxingAI成本行业观点推荐理由:微软CEO也逃不过token上瘾原文
22:17Decoder@Maximilian Schreiner本文探讨了生成式AI从订阅制向按Token消耗计费的转变,特别是智能体工作流消耗大量Token,使固定费率模式难以为继。Token价格因速度、专业性和结果的经济价值而异,但仅看Token消耗量无法衡量AI的价值创造。文章分析了新兴的Token经济:计费如何从订阅转向消费,低Token价格为何掩盖实际成本,以及为何Token消耗是错误的价值衡量标准。行业Token经济智能体商业模式定价策略AI成本推荐理由:做AI产品定价或运营的团队,这篇文章帮你理解为什么智能体工作流正在颠覆传统订阅模式,以及如何从Token经济中设计可持续的商业模式。建议点开看看,尤其是对成本敏感或正在构建智能体产品的开发者。原文
16:30IT之家(博客/媒体)美国企业AI投入突破1万亿美元,但模型推理成本持续上涨,降本增效未达预期。Ramp报告显示,DeepSeek首次登上企业软件趋势榜榜首,成为增长最快的供应商。某企业一个月为Claude支付5亿美元,Uber四个月耗尽全年Token预算。DeepSeek宣布API价格永久下调75%,性价比成为进军全球B2B市场的主要武器。Ramp首席经济学家指出,这是美国企业主动寻找OpenAI、Anthropic低成本替代方案的明确信号。行业DeepSeekAI成本B2B市场企业支出模型推理10 个信源在谈推荐理由:AI成本失控让美国企业转向中国模型,DeepSeek的降价策略直接击中痛点,做企业采购或AI预算管理的团队值得关注这个趋势。原文
10:51IT之家(博客/媒体)OpenAI CEO山姆·奥尔特曼透露,公司内部词元消耗冠军每月使用约1000亿个词元,远超六年前的10万个。外部用户消耗更高,令其难堪。OpenAI内部设有词元消耗排行榜,员工常炫耀高使用量,而其他企业如亚马逊、Uber则在严控成本。奥尔特曼表示,AI成本问题已从2026年初的无人关注变为当前重大难题,OpenAI正探索降本增效方案。行业OpenAI词元消耗AI成本企业应用行业趋势10 个信源在谈推荐理由:AI成本飙升已成行业痛点,OpenAI内部的高消耗案例揭示了模型使用成本失控的风险,做AI应用或模型部署的团队值得关注,避免重蹈覆辙。原文
00:13掘金本周最热@CodeSheepUber CTO透露,公司原本覆盖2026年全年的AI费用预算,仅在今年前4个月就被烧光,单个员工月均AI使用费高达500-2000美元。英伟达深度学习部门VP也表示,其团队算力成本已远超员工成本。这反映了AI时代算力消耗的经济特征与传统软件边际成本趋近于零的逻辑截然不同。随着Agent普及,AI从简单问答变为自主拆解任务、循环推理的动态系统,token消耗呈指数级增长。许多公司仍沿用老旧管理思维,将token消耗量作为KPI,导致粗放投入和资源浪费。文章指出,企业需从单纯上工具转向真正改变工作流程,将token用在价值创造的关键环节。行业AI成本token消耗企业管理Uber算力经济推荐理由:这篇文章戳中了AI转型期企业的真实痛点——算力成本失控,做AI落地或管理AI团队的负责人看完会重新审视自己的token账单和投入策略。原文
17:11阿里云 Alibaba Cloud@alibaba_cloud阿里云联合Appnovation举办线上战略简报,探讨Qwen模型如何帮助企业重新思考AI性能与成本的平衡。简报将分享全球领导者选择Qwen的原因,以及团队保持竞争力所需的关键信息。活动定于6月9日周二上午11点(太平洋时间)举行,时长55分钟,需注册参与。行业Qwen阿里云AI成本企业AI战略简报推荐理由:正在评估AI模型性价比的企业团队,可以直接了解Qwen在性能与成本上的实际表现,建议注册参加简报获取一手信息。原文
16:43IT之家(博客/媒体)微软要求员工改用自研Copilot CLI而非Claude Code,因后者使用成本随用户增多而攀升。其他企业也在缩减AI工具使用规模,智能体词元消耗量可达普通大语言模型查询的上千倍。OpenClaw创始人称其团队单月词元使用成本超130万美元(约885.6万元人民币)。词元单价下降但使用量上涨,体现杰文斯悖论,AI开销已高于人力成本且效率提升有限。行业大模型AI成本智能体微软Claude4 个信源在谈推荐理由:AI成本比人力还高,企业别盲目推原文
11:55Gary Marcus@GaryMarcusGary Marcus引用Hedgie的推文指出,微软因token计费成本过高,本周取消了内部Claude Code许可,即使拥有无限云资源也难以承受。Uber CTO内部备忘录警告公司2026年AI预算在四个月内耗尽。美国AI软件价格已上涨20%-37%,GitHub也放弃固定费率转向按用量计费。Marcus认为AI补贴时代正在终结,企业面临缩减使用或接受亏损的两难选择。行业Token计费AI成本企业AI微软Claude Code推荐理由:Token计费正在戳破AI成本泡沫,做企业AI部署的团队会发现预算比想象中烧得快得多,建议点开看看真实案例。原文
08:05Thomas Wolf@Thom_Wolf微软因基于 token 的计费成本过高,本周取消了内部 Claude Code 许可证,即使拥有无限云资源也难以承受。Uber CTO 内部备忘录警告,公司在四个月内烧光了 2026 年整个 AI 预算。美国 AI 软件价格已上涨 20% 至 37%,GitHub 也正从固定费率转向按用量计费。AI 补贴时代正在终结,token 定价迫使企业面对大规模运行模型的真实成本,远高于固定费率实验时的预期。这可能导致企业缩减 AI 使用以匹配预算,或实验室降价吸收亏损,两种路径都指向数字不再奏效,最终需要有人承担减值。行业开源模型AI成本企业级AItoken计费微软推荐理由:AI 补贴时代正在终结,企业级用户和开发者需要重新评估 AI 成本——微软和 Uber 的案例是真实预警,做 AI 采购或预算规划的人值得点开了解。原文