08:24berryxia@berryxia前Meta产品经理Qu Xiaoyin预测,2026年上半年中国开源模型(DeepSeek V4、Qwen3.5、GLM-5.2)能力追平部分闭源模型。她指出欧企业可把中国模型部署在自己的GPU上,满足数据合规(数据不出境)并获完全控制权。开源模型允许企业用内部数据微调成专属模型,而OpenAI和Anthropic的闭源API做不到。成本方面,闭源API按token收费,开源模型一次性部署后边际成本趋近零。但部署运维需专业团队,AWS、Azure、阿里云已提供托管服务降低门槛。行业OpenAIAnthropicDeepSeekQwenGLM开源模型企业部署10 个信源在谈推荐理由:前Meta产品经理说欧美企业会抛弃OpenAI和Anthropic转向中国开源模型,因为能本地部署、定制微调,成本还低。想省钱的老板可以听听。原文
06:35vLLM@vllm_projectvLLM 社区正在将 DeepSeek 的 DSpark 推测解码算法集成到 vLLM 推理引擎中。DSpark 是一种推测解码算法,能显著提升大语言模型的推理速度。该集成旨在为所有 vLLM 用户带来更快的推理性能,无需额外配置。目前社区正在积极开发中,预计将提升 vLLM 的吞吐量并降低延迟。AI模型vLLMDeepSeekDSpark推理加速开源模型推荐理由:vLLM 社区正在把 DeepSeek 的 DSpark 算法加进来,推理速度能再上一个台阶,用 vLLM 的朋友可以期待了。原文
03:06@koltregaskes@koltregaskes79°DeepSeek v4 将于 7 月中旬进入通用可用(GA)阶段,部分用户已收到相关邮件通知。该版本带来更多功能优化和性能改进。具体改进细节尚未完全公开,但用户可期待更优的模型能力。AI模型DeepSeek v4DeepSeek开源模型推理模型推荐理由:DeepSeek v4 马上 GA 了,7 月中旬上线,性能有优化,想尝鲜的可以关注。原文
06:45Clement Delangue@ClementDelangueDeepSeek 推出加速模型集合,其中 Gemma-4-12B 可能包含视觉能力。该模型在其 12B 参数量级别中,本地运行性能显著优于同类竞品。该集合未包含 Qwen 3.5,推测因 DeepSeek 未采用线性注意力机制。AI模型DeepSeekGemma-4-12B加速模型本地模型视觉推荐理由:DeepSeek 把 Gemma-4-12B 加速了,还带视觉,本地跑起来应该是同尺寸里最强的之一。原文
00:21berryxia@berryxia精选73°DeepSeek开源了DSpark投机解码框架,用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题,并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中,单用户生成速度比MTP-1基线快60-85%,不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。AI模型DeepSeekDSparkDeepSeek-V4投机解码推理优化推荐理由:DeepSeek开源了DSpark框架,能让你的V4模型推理提速60%以上,且不影响质量。它解决了投机解码在真实部署中的难题,已经稳定跑在生产环境。原文
11:19Geek@geekbb有传闻称DeepSeek官方V4 API在2024年8月上线两周后,便开始使用氮气加速技术DSpark。该说法源自社区讨论,目前官方未确认。DSpark是DeepSeek自主研发的推理加速方案,可降低延迟和成本。若属实,则V4 API在发布后快速引入了性能优化。AI产品DeepSeekV4DSpark推理加速推荐理由:听说DeepSeek V4 API悄悄用上DSpark加速了?上线才两周,这速度有点猛。原文
00:49Geek@geekbb73°DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩:LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%,超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文,并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署,引发社区期待。AI模型DeepSeekPro Max编码基准开源模型推荐理由:DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6,分数拉满,但还没开放下载,先来围观一下。原文
22:42Gary Marcus@GaryMarcusUBS调查显示,60%监控AI预算的企业已开始转向更便宜的模型和开源中国模型。企业面临极端账单,有用户每月花费高达35,000美元,团队超出配额200%,部分公司从5个AI内部工具削减至2个。企业通过模型路由策略,将简单任务分配给便宜模型,如Qwen、DeepSeek、MiniMax、GLM、Kimi,而保留高级模型用于推理、编程和长上下文任务。这些中国开源模型可以本地运行或通过云目录使用,符合企业成本曲线。行业UBSDeepSeekQwenMiniMax开源模型成本优化企业AI应用推荐理由:大厂AI账单太高了,UBS说60%的企业已经在换更便宜的模型,像DeepSeek、Qwen这些中国开源模型成了新选择。想省钱的企业可以看看这个趋势。原文
15:58李继刚@lijigang_com长期与Claude或DeepSeek等模型对话,你的语言风格会不自觉地模仿对方。重度使用后,说话会带出「Claude味儿」「DeepSeek味儿」。进行30天月度主题阅读,沉浸在同一主题的上下文中,能加深理解并切换看问题视角。技巧ClaudeDeepSeek语言风格主题阅读推荐理由:长期用Claude或DeepSeek聊天,说话会带味儿,还能用主题阅读切换视角,亲测有效原文
14:25OpenRouter@OpenRouterAIOpenRouter 分享了 GLM 和 DeepSeek 两个模型家族的版本采用时间线图。数据展示了用户在不同版本之间的迁移趋势。图表包含 2 条回复、2 次转发、29 个喜欢和 3042 次查看。这反映了开源模型社区的版本使用动态。行业OpenRouterGLMDeepSeek模型采用版本迁移推荐理由:想了解 GLM 和 DeepSeek 用户都升级到了哪个版本?OpenRouter 这张图一目了然。原文
08:05berryxia@berryxia百度开源了Unlimited OCR模型,采用R-SWA(参考滑动窗口注意力)机制,一次前向推理即可处理32K上下文的文档,数十页PDF无需分块。与传统逐页处理的OCR不同,其KV Cache大小恒定,不随长度增长。模型灵感源于人类抄书行为,仅维护近128个状态。技术报告核心贡献者中,技术总监YY疑为DeepSeek前员工。AI模型Unlimited OCR百度DeepSeekR-SWA文档理解6 个信源在谈推荐理由:百度开源的Unlimited OCR能一口气读完几十页PDF,不用切块,快又准。技术总监YY可能是DeepSeek出走的,有意思。原文
00:24向阳乔木@vista8DeepSeek Harness组作为新部门,正在大规模招聘三种职位:Harness研究员(实习/全职)、Harness工程师(实习/全职)、Harness产品经理(限全职)。招聘流程与其他部门一致,包含一轮笔试和三轮面试,终面由Tianyi Cui负责。职位空缺较大,简历可直接私信发送。行业DeepSeekHarness组Tianyi Cui招聘推荐理由:DeepSeek Harness组在招研究员、工程师和产品经理,门槛不低但机会难得,想加入国产大模型核心团队的朋友可以试试看。原文
22:27shao__meng@shao__mengDeepSeek 新成立的 Harness 组由 Tianyi Cui 带队,目标远大、工作繁重,目前仍非常缺人。招聘共三种职位:Harness 研究员(实习/全职)、Harness 工程师(实习/全职)、Harness 产品经理(限全职)。招聘流程为一轮笔试加三轮面试,终面由 Tianyi Cui 负责。该组专注于 Agent Harness 研究和工程,职位空缺较大但门槛与 DS 其他组一致。行业DeepSeekHarness招聘Agent工程推荐理由:DeepSeek Harness 组在招人,研究员、工程师、产品经理都要,做 Agent Harness 的可以直接投简历。门槛不低但机会大。原文
03:54Suhail@Suhail精选Z.ai推出GLM-5.2开源模型,采用MIT开放权重。该模型支持1M上下文窗口,在Terminal-Bench 2.1基准上得分81.0,仅比Claude Opus 4.8低几分。Perplexity CEO此前指出,中国已拥有最强开源模型DeepSeek,且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。AI模型GLM-5.2Z.aiDeepSeek开源模型推理模型推荐理由:Z.ai刚刚放出了GLM-5.2,MIT开源、100万上下文、跑分81.0,跟Claude Opus 4.8差距很小,做开源模型的得看看。原文
00:37Geek@geekbb精选一个名为 handoff 的开源工具让你在 Claude Code 或 Codex 会话中直接委托任务给 DeepSeek 等其他模型。典型用法是让 Claude 负责规划与审阅,DeepSeek 负责执行代码。这种方式能降低 API 成本,同时保持高开发效率。该方案已获得社区关注,相关仓库在 GitHub 上可见。技巧ClaudeDeepSeekClaude CodeCodex编程助手推荐理由:想省钱又能干活?让 Claude 当项目经理、DeepSeek 当写代码的,这个工具帮你搞定。原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
04:02Gary Marcus@GaryMarcus微软正在探索将DeepSeek作为Copilot Cowork的底层模型,替代OpenAI和Anthropic。同时Copilot Cowork转向基于使用量的定价模式,微软表示有用户每周执行数百个任务,成本可能非常高。这一举动被分析认为伤害了OpenAI和Anthropic的潜在IPO。事件涉及Jevons悖论,即效率提升可能导致总用量增加。行业微软DeepSeekOpenAIAnthropic定价策略10 个信源在谈推荐理由:微软可能换掉OpenAI和Anthropic,改用DeepSeek给Copilot Cowork,还改了按用量收费。这事直接影响两家公司上市计划,值得关注。原文
03:38@koltregaskes@koltregaskesDeepSeek 4.1 版本预计于本周发布。该版本是 DeepSeek 系列的最新迭代,具体性能数据尚未公布。用户可关注官方渠道获取更新信息。AI模型DeepSeekDeepSeek 4.1模型发布开源模型推荐理由:DeepSeek 要发新版本了,听说这周就上线,看看有什么进步。原文
11:12Geek@geekbb这是一个开源的 Windows 小工具,可以实时监控 DeepSeek API 的余额和用量。它通过调用 DeepSeek 官方 API 接口获取数据,并在本地展示剩余额度。工具适用于需要管理 DeepSeek 账户 API 消耗的用户。GitHub 上提供了安装和使用说明。AI产品DeepSeekAPI余额监控Windows工具推荐理由:能实时看 DeepSeek API 余额原文
10:20向阳乔木@vista8精选该工具输入任意App名称即可自动抓取AppStore用户评价,并通过DeepSeek进行四类信息挖掘:用户正面/负面评价、问题与版本更新的关联、产品机会识别、可视化图表输出。产品预计下周开源,可帮助产品经理快速从评论中提取 actionable 信息。技巧DeepSeekAppStore产品经理用户评论挖掘数据分析推荐理由:帮你用DeepSeek挖掘AppStore评论,找出产品机会原文
09:52Geek@geekbb精选一个名为 Archify 的开源项目展示了通过 LLM(如 pi 和 DeepSeek)将自然语言描述转换为结构化 JSON,再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型,仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上,提供了一种轻量级的 AI 绘图新思路。技巧DeepSeekpiArchifySVG开源模型推荐理由:不用生图模型也能画图原文
12:38Dylan Patel (SemiAnalysis)@dylan522p该分析报告对 DeepSeek 推理系统在多种硬件平台上的性能进行了详细评估,包括 NVIDIA GB200 NVL72、Blackwell、AMD MI355X 以及华为的芯片。报告还提供了过去 44 天内每日性能随时间变化的追踪数据。这些数据对于理解不同硬件在 AI 推理任务中的实际表现和稳定性具有重要参考价值,尤其适合关注硬件选型和性能优化的 AI 工程师。行业DeepSeek推理性能GB200 NVL72BlackwellAMD MI355X华为硬件对比10 个信源在谈推荐理由:这份 44 天的性能追踪数据对做 AI 推理部署的团队很有价值,能直观对比 NVIDIA、AMD 和华为硬件的实际表现,建议点开看具体趋势。原文
14:15AI产品黄叔@PMbackttfuture针对Codex写作内容AI味重的问题,作者提出使用Skill功能在不同阶段指定不同模型(如GPT5.5与DeepSeek交互配合)来优化输出。通过将内容整理后交付给DeepSeek写作,再由Codex审查,显著改善了逐字稿质量。该方法在保持Codex性价比、推理和Agentic能力的同时,解决了其理工直男式的写作风格问题。AI产品CodexGPT5.5DeepSeek写作优化Skill推荐理由:做内容创作的开发者终于不用在AI味和性价比之间二选一了——用Skill混合模型就能让Codex写出更自然的文本,建议试试这个组合策略。原文
13:15宝玉@dotey精选DeepSeek 发布全球首个“Agent Harness 研究员”岗位,旨在将前沿模型能力转化为领先的 Agent 产品。该岗位负责 Harness 领域的前沿创新,包括上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等。团队使命是“Model + Harness = Agent”,除模型本身外所有工作都属于 Harness 范畴。任职要求包括科研背景、全栈开发能力、Agent 重度使用经验,以及对 LLM 和 Agent 机制的深入理解。这一招聘标志着 Agent 基础设施研究正式成为独立岗位,对 Agent 开发者和研究者意义重大。行业DeepSeekAgent Harness招聘智能体基础设施推荐理由:DeepSeek 把 Agent 基础设施研究独立成岗,做 Agent 开发的团队可以直接参考其职责定义,想入行 Agent 研究的也可以看看门槛和方向。原文
00:51向阳乔木@vista8作者对比Fable 5后强调大模型降价的重要性,称赞DeepSeek v4 flash极其便宜,每月翻译大量内容仅花费几十元。作者将自己的AI雷达Skill转化为网站,支持双语对照翻译和AI侧边栏对话。网站本周上线,输入DeepSeek API即可使用AI功能,同时支持人工点评。作者计划下周开源该项目。AI产品DeepSeekv4 flash开源/仓库翻译工具AI侧边栏推荐理由:DeepSeek v4 flash 的低成本让个人开发者也能轻松跑翻译和AI功能,做工具型产品的团队值得关注这个开源项目,可以直接用或参考。原文
19:26SiliconFlowAI@siliconflowaiDeepSeek 在 OpenRouter 平台上的 Token 使用量连续四周排名第一,显示出其模型在开发者社区中的广泛采用。SiliconFlow 宣布为这一份额提供重要支持,并提供了完整的 DeepSeek 模型系列,包括 V4 Pro、Flash、V3.2 等,其中 V4 Pro 和 Flash 以最佳性价比著称。这一趋势反映了 DeepSeek 在开源模型领域的竞争力,尤其是在推理和编程任务上的表现。AI模型DeepSeekOpenRouterToken 份额开源模型SiliconFlow推荐理由:DeepSeek 连续四周霸榜 OpenRouter Token 份额,说明开发者正在大量使用其模型做推理和编程。如果你在找性价比高的开源模型,SiliconFlow 上 V4 Pro 和 Flash 值得试试。原文
11:49Geek@geekbb精选Ore Code 是一款专为 DeepSeek 设计的桌面端 AI 编码工作台,支持 macOS 和 Windows。它聚焦长上下文编码、结构化工具调用、本地项目上下文理解,并集成了 MCP 协议、技能和自动化功能。该项目已在 GitHub 开源,旨在为开发者提供更高效的 AI 辅助编程体验。AI产品DeepSeek桌面端AI 编码工作台MCP/工具开源/仓库4 个信源在谈推荐理由:如果你在用 DeepSeek 做编码,Ore Code 把长上下文、工具调用和项目上下文整合到了桌面端,省去来回切换的麻烦,做 AI 编程的开发者可以直接下载试试。原文
08:32berryxia@berryxia国内前5家纯LLM公司总估值达2260亿美元,约为Anthropic最新估值的四分之一,但收入运行率仅为Anthropic的1/40。智谱估值领先DeepSeek,显示出国内开放权重模型在大量融资的同时,实际收入较低。这凸显了AI行业的核心矛盾:市场在为AI的什么部分支付溢价?当模型能力商品化、价格下降后,估值逻辑需重新审视。该现象引发对国内低价开放权重模式是否为短期策略或未来全球竞争主流模式的讨论。行业智谱DeepSeek估值开放权重AI商业模式10 个信源在谈推荐理由:这篇帖子揭示了国内AI公司估值与收入的巨大鸿沟,做投资或关注AI商业模式的读者值得一看,能帮你理解市场对开放权重模型的真实定价逻辑。原文
16:32Viking@vikingmute一位开发者分享了其每次代码审查后生成的产物结构:每个功能一个文件夹,每个模型一份报告(如Claude.md、Codex、Composer等)。有趣的是,DeepSeek Pro在报告中自称是Claude。报告包含问题汇总、修复计划、状态跟踪和验证结果,形成完整的审查闭环。这种结构化方法有助于系统化追踪AI模型在代码审查中的表现和修复进展。AI产品代码审查模型对比工作流ClaudeDeepSeek推荐理由:做AI代码审查或模型对比的团队,可以直接参考这套文件夹+报告结构来标准化工作流,省去重复整理的时间。原文
18:06shao__meng@shao__meng作者因代理问题无法连接 Codex,转而让 Cursor 分析并修复网络问题。Cursor 不仅自动诊断代理实现、修改代理方式,还通过 CLI 成功调用 Codex。更贴心的是,Cursor 还利用作者之前提供的 DeepSeek API Key,一键切换 Codex 的底层模型,确保代理出问题时仍能使用。这一过程展示了 Coding Agent 在开发之外的运维和问题解决能力。AI产品Coding AgentCursorCodexDeepSeek代理/网络10 个信源在谈推荐理由:这个案例展示了 Coding Agent 在开发之外的运维和故障排查能力,做 AI 工具集成或依赖代理的开发者看完会重新思考 Agent 的边界,值得一试。原文
06:13rohanpaul_ai@rohanpaul_ai本期新闻简报涵盖多项AI与芯片领域重要进展:华为公布芯片设计新突破,有望缩小与台积电、英特尔的差距;阿里巴巴与南京大学联合论文提出通过选择性稀疏注意力机制,使标准LLM高效处理超长上下文;深度分析DeepSeek的真正优势不在于廉价聊天机器人,而在于将硬件稀缺转化为策略的架构创新;Meta、斯坦福与伊利诺伊大学联合调研论文主张AI智能体在代码作为主要工作层时表现更佳;Anthropic联合创始人警告AI导致的失业将引发历史性道德危机;xAI向SuperGrok和X Premium+用户推出终端原生智能体“Grok Build”。行业华为芯片设计长上下文DeepSeek智能体Grok BuildAI失业10 个信源在谈推荐理由:芯片开发者、长上下文研究者、智能体实践者都能从中找到硬核洞察——华为的突破可能重塑竞争格局,阿里论文直接解决长文本推理痛点,DeepSeek的架构思路值得借鉴。建议花5分钟扫读,挑与自身领域相关的深度内容细看。原文
11:31Geek@geekbbDeepSeek 在 X 平台发文感谢小米 MiMo,宣布 MiMo-V2.5 系列 API 价格永久降低,最高降幅达 99%,并统一了所有上下文长度的定价。同时,MiMo Token 计划升级,同等价格下可用 token 数量增加 5-8 倍,计费规则更简单透明。现有用户的 Token Plan 积分将全部重置,MiMo-V2.5-TTS 在限定时间内免费。这些改进得益于 MiMo 堆栈的推理优化和服务效率提升,相关技术博客后续发布。AI产品DeepSeek小米 MiMoAPI 降价推理优化语音合成推荐理由:API 价格直降 99% 对开发者是实打实的成本利好,做 AI 应用集成或语音合成的团队可以直接切换,省下预算做更多实验。原文
16:11AI Will@FinanceYF5DeepSeek 宣布将 V4-Pro 模型的 API 价格永久下调 75%,降至原价的 25%。此举被认为与中国 AI 基础设施从受限的 NVIDIA GPU 转向华为昇腾 950 芯片有关,供应链改善推动了推理成本下降。路透社报道指出,虽然 DeepSeek 未明确确认昇腾 950 供应增加是降价主因,但时间点暗示了中国 AI 成本曲线正在持续下移。这一变化意味着中国 AI 模型在价格竞争力上进一步逼近甚至超越国际对手。AI产品DeepSeekV4-Pro华为昇腾推理成本API降价推荐理由:DeepSeek 把 V4-Pro 价格砍到原价四分之一,做 API 调用的开发者和企业可以直接省下大笔推理成本,建议关注华为昇腾生态的性价比变化。原文
14:24AI Will@FinanceYF5路透社报道,DeepSeek 已将其 V4-Pro 模型的 API 价格永久下调至原价的 25%。此前该模型曾推出限时降价,如今转为长期政策。DeepSeek 未确认此次降价是否与华为昇腾 950 芯片供应改善有关。这一举措将大幅降低开发者调用该模型的成本,可能引发更多 AI 应用采用。AI产品DeepSeekAPI 降价V4-Pro成本优化华为昇腾推荐理由:API 价格降至四分之一,调用 DeepSeek V4-Pro 的开发者成本直接砍半以上,做推理或批量任务的团队值得立刻关注。原文
09:58Viking@vikingmute精选Reasonix 是一个针对 DeepSeek 的 prefix cache 优化工具,近期在开发者社区走红。它通过优化缓存机制,在长会话场景下能将缓存命中率保持在 90% 以上,从而将输入 token 成本降低到原来的五分之一。对于高频使用 DeepSeek 的重度用户,这是一个值得尝试的实用工具,能显著降低 API 调用成本。AI产品DeepSeekprefix cache成本优化开源/仓库Reasonix推荐理由:DeepSeek 重度用户每月 API 账单能省一大截——长会话场景下缓存命中率 90%+,输入成本直接砍到 1/5,做对话应用或批量推理的团队建议立刻试试。原文
17:38AI Will@FinanceYF5DeepSeek 放弃编程套餐、多模态等热门方向,坚持开源策略,看似自废武功,实则意在构建一个 10 万亿美元的中国 AI 硬件生态。它不追求短期几亿美元的生意,而是通过开源降低门槛,吸引更多硬件厂商和开发者加入,形成以中国为核心的 AI 硬件产业链。这一战略若成功,将重塑全球 AI 硬件格局,让中国在 AI 基础设施层面占据主导地位。行业DeepSeek开源AI 硬件中国 AI 生态战略分析推荐理由:做 AI 硬件或关注中国 AI 生态的开发者,DeepSeek 的开源战略可能改变你的技术选型和商业机会,值得深入理解其背后的逻辑。原文
04:36rohanpaul_ai@rohanpaul_ai路透社报道,DeepSeek 将其旗舰模型 V4-Pro 的 API 价格永久下调75%,降至原价的25%。虽然 DeepSeek 未确认降价与华为 Ascend 950 芯片供应改善直接相关,但时机表明,随着中国 AI 基础设施从受限的英伟达芯片转向华为硬件,成本曲线正在下移。这一降价将使更多开发者和企业能够以更低成本使用高性能 AI 模型,推动中国 AI 生态的普及。AI产品DeepSeekV4-ProAPI降价华为芯片成本优化推荐理由:DeepSeek V4-Pro 永久降价75%意味着调用成本降至原来的四分之一,做 AI 应用开发或依赖 API 的团队可以直接降低运营成本,值得关注这一价格变动对模型选型的影响。原文
02:06berryxia@berryxia83°DeepSeek 是一家中国 AI 公司,面对美国 GPU 禁运,没有堆算力,而是通过算法创新(如 KV Cache 压缩 90%、MoE 极致优化、Engram 模块)大幅降低训练和推理成本。其 V4 Pro 模型在 1M 上下文下仅需 5.48GB HBM,远低于竞品。这些技术不仅让长时序 Agent 经济可行,还盘活了中国 NAND 和 LPDDR 资源,缓解 HBM 依赖。DeepSeek 开源了整个框架,旨在打造 10 万亿美元的 AI 硬件新生态,估值目标 1 万亿美元。AI产品DeepSeekMoEKV Cache开源/仓库硬件生态推荐理由:DeepSeek 用算法创新打破了 GPU 禁运的困局,做长上下文 Agent 的开发者可以直接用 V4 Pro 体验成本暴降的效果,做硬件生态的团队值得研究其开源架构。原文
19:34Geek@geekbbDeepSeek GUI 是DeepSeek TUI的桌面图形界面版本,支持多会话聊天、流式输出和工具调用审批。用户可审查智能体修改的文件,每次改动显示diff。该项目已在GitHub开源,提供更直观的AI交互体验。AI产品DeepSeek开源/仓库智能体MCP/工具推荐理由:把终端AI搬到桌面,支持diff审查原文
15:34orange.ai@oran_geDeepSeek V4 Pro模型在性能上并非最佳,但其缓存技术几乎免费,可大幅降低推理成本。Opus模型应用该技术后成本下降10倍。V4.1版本将使用真实harness数据训练,有望快速提升性能。AI模型大模型DeepSeek缓存成本优化推荐理由:缓存技术让成本降10倍原文