全部 AI 动态 · AI 热点

AITOP

5月24日

15:34

orange.ai@oran_ge

DeepSeek V4 Pro模型在性能上并非最佳，但其缓存技术几乎免费，可大幅降低推理成本。Opus模型应用该技术后成本下降10倍。V4.1版本将使用真实harness数据训练，有望快速提升性能。

AI模型大模型 DeepSeek 缓存成本优化

推荐理由：缓存技术让成本降10倍

原文

13:52

rohanpaul_ai@rohanpaul_ai

精选75°

DeepSeek 通过 MoE、DSA 和 V4-Pro 的 CSA/HCA 技术，将 1M-token 单 token 推理 FLOPs 降至 V3.2 的 27%，KV 缓存降至 10%。其 Engram 研究线利用可扩展查找内存替代密集计算。Reuters 报道 V4-Pro 永久降价 75%，同时面临华为昇腾供应限制。这些举措旨在减少对 HBM 和高端 GPU 的依赖，使中国内存、加速器和系统适用于前沿 AI。

AI模型 DeepSeek MoE DSA 推理模型大模型

推荐理由：DeepSeek 用架构创新绕过硬件瓶颈

原文

5月23日

09:17

OpenRouter@OpenRouterAI

Warp 终端宣布支持 OpenRouter，用户可以直接在 Warp 中连接遵循 OpenAI Chat Completions API 的推理端点，包括 OpenRouter、LiteLLM、Zai_org、DeepSeek 等。工程师 Dagm Assefa 演示了如何连接 DeepSeek 和 OpenRouter。这一集成让开发者无需离开终端即可调用多种 AI 模型，简化了 AI 编程工作流。相关文档已在 Warp 官网更新。

AI产品 Warp OpenRouter DeepSeek 终端集成 AI 编程

推荐理由：终端用户终于可以在 Warp 里直接调用 OpenRouter 和 DeepSeek 等模型，省去切换窗口的麻烦。做 AI 编程或频繁测试模型的开发者，建议试试这个集成，能显著提升效率。

原文

02:23

rohanpaul_ai@rohanpaul_ai

72°

据彭博社报道，DeepSeek 正在进行 102.9 亿美元的融资谈判，创始人梁文锋明确表示将优先推进 AGI（通用人工智能）研发，而非追求短期商业化。梁文锋承诺继续开发开源 AI 模型，这一战略与当前许多 AI 公司追求快速盈利的趋势形成鲜明对比。该融资若完成，将成为 AI 领域最大规模融资之一，凸显 DeepSeek 在开源 AGI 路线上的坚定决心。

行业 DeepSeek AGI 开源融资 AI 战略

推荐理由：DeepSeek 在巨额融资中坚持开源 AGI 优先，这对关注 AI 长期发展的开发者和研究者是个重要信号——开源路线并未被资本裹挟，值得持续关注其模型进展。

原文

01:06

Geek@geekbb

DeepSeek-V4-pro 模型 API 价格将在 2026年5月31日 23:59 结束 2.5 折优惠活动后，正式调整为原定价的 1/4。这意味着长期使用成本大幅降低，对开发者和大模型应用团队是重大利好。该调整是永久性的，而非短期促销。消息来自社区分享，引发广泛关注。

AI产品 DeepSeek API价格模型调用成本优化开发者

推荐理由：DeepSeek-V4-pro API 价格直接降到原价1/4，做 AI 应用开发和模型调用的团队成本压力骤减，建议关注并提前规划迁移或扩容。

原文

5月22日

16:34

阿里云 Alibaba Cloud@alibaba_cloud

阿里云发布了在PAI-EAS平台上部署DeepSeek V4-Flash的成本效益分析，通过实际基准测试和定价数据比较了不同部署选项。该分析旨在帮助用户找到每美元性能最佳的方案，适合需要优化AI模型部署成本的开发者和企业。视频演示了具体对比结果，为选择最经济的部署方式提供参考。

AI产品 DeepSeek 阿里云 PAI-EAS 模型部署性价比

推荐理由：做AI模型部署的团队终于有了明确的性价比参考——阿里云用真实数据告诉你DeepSeek V4-Flash怎么部署最省钱，建议做成本优化的点开看看。

原文

14:00

OpenRouter@OpenRouterAI

精选

DeepSeek V4 Flash 在 OpenRouter 每周排行榜中登顶，获得 1196 次浏览和 38 个点赞。该模型是 DeepSeek V4 的轻量版本，表现出色。OpenRouter 排行榜基于用户使用量和反馈，V4 Flash 的领先显示了其在开发者中的受欢迎程度。

AI模型 DeepSeek V4 Flash DeepSeek OpenRouter 推理模型

推荐理由：DeepSeek新模型登顶社区排行榜

原文

5月21日

11:39

Tw93@HiTw93

精选

Kaku 终端发布 V0.11.0 版本，这是一款为 AI 编程设计的快速、开箱即用的终端。新版本增加了对 DeepSeek、GLM、Kimi、Fireworks 等模型的隐藏推理支持，改进了会话恢复和初始化设置体验。同时修复了全屏标签、标题栏拖拽、光标渲染、低 DPI 文本和彩色 emoji 大小等细节问题。AI 流式传输、输入法输入、代理处理和多提供商传输也更加稳定。

AI产品 AI 编程终端 Kaku DeepSeek GLM

推荐理由：Kaku 把 AI 作为终端的一等公民，做 AI 编程的开发者可以直接用它替代传统终端，体验更流畅的 AI 交互。

原文

5月18日

17:12

AlphaSignal@AlphaSignalAI

76°

本周（5月11日至17日）GitHub 热门仓库包括 DeepSeek 4 Flash 本地推理引擎（支持 Metal 和 CUDA）、更稀疏快速的 Transformer 语言模型、利用 WiFi 信号实现空间感知的 RuView、面向法律工作流的 Claude 插件套件，以及 X 平台开源的 feed 排序算法。这些项目覆盖了模型推理、架构优化、环境感知、行业应用和算法透明化等多个方向，值得开发者关注。

AI产品 DeepSeek 本地推理 Transformer WiFi感知开源

推荐理由：做本地推理或模型优化的开发者可以看看 DeepSeek 4 Flash 和稀疏 Transformer 项目，前者直接提升 Metal/CUDA 部署效率，后者可能改变模型架构设计思路。法律从业者或对行业 AI 应用感兴趣的人，Claude 插件套件提供了现成的 workflow 参考。

原文

5月16日

22:58

Yangyi@Yangyixxxx

DeepSeek 正在招聘 Agent Harness 产品经理，团队使命是“Model + Harness = Agent”，将前沿模型能力转化为领先的 Agent 产品。该职位将参与桌面端 Agent 产品全过程，定义 Harness 理念，要求候选人深度使用过 Claude Code、Cursor 等主流 Agent 产品，并具备数据分析、UI/UX 设计等能力。有评论认为桌面 Agent 潜力巨大，更期待 DeepSeek 直接做操作系统，挑战将完全不同。这标志着 DeepSeek 正从模型公司向 Agent 平台转型，对 AI 产品经理和 Agent 生态开发者是重要信号。

行业 DeepSeek Agent 产品经理桌面端 Harness

推荐理由：DeepSeek 正式进军桌面 Agent 领域，做 Agent 产品经理或关注 Agent 生态的开发者值得关注——这可能是定义下一代人机交互范式的机会。

原文

19:58

宝玉@dotey

DeepSeek 正在招聘 Agent Harness 产品经理，负责将前沿模型能力转化为领先的 Agent 产品。该职位属于 Harness 团队，涵盖模型之外的所有工作，包括产品路线规划、用户需求分析、与研究员协作实现模型与 Harness 共同进化，以及维护用户社群。任职要求包括 2 年以上产品经验、能使用 vibe coding 写代码、是 Agent 产品的高强度用户，并熟悉 LLM 及 Agent 技术原理。这标志着 DeepSeek 正式加速 Agent 产品化，为 AI 产品经理提供了参与定义下一代人机交互范式的机会。

行业 DeepSeek Agent 产品经理招聘 Harness

推荐理由：DeepSeek 首次公开招募 Agent 产品经理，把模型能力转化为可用产品的关键岗位，做 AI 产品经理或想切入 Agent 赛道的开发者值得关注，这可能是定义未来 Agent 交互范式的机会。

原文

5月14日

13:37

深度求索 DeepSeek@deepseek_ai

78°

DeepSeek 正式发布 V3.2 和 V3.2-Speciale 两个新模型。V3.2 是 V3.2-Exp 的正式继任者，已在 App、Web 和 API 上线；V3.2-Speciale 则专注于极致推理能力，目前仅通过 API 提供。这两个模型以推理优先为设计理念，旨在更好地支持智能体（agent）场景。技术报告已同步公开。

AI模型 DeepSeek 推理模型智能体模型发布 API

推荐理由：做智能体开发或需要强推理能力的团队，DeepSeek 这次直接给了两个新选择——V3.2 可立即上手，Speciale 适合追求极致推理的 API 用户，值得关注技术报告里的细节。

原文