全部 AI 动态 · AI 热点

6月30日

06:35

vLLM@vllm_project

vLLM 社区正在将 DeepSeek 的 DSpark 推测解码算法集成到 vLLM 推理引擎中。DSpark 是一种推测解码算法，能显著提升大语言模型的推理速度。该集成旨在为所有 vLLM 用户带来更快的推理性能，无需额外配置。目前社区正在积极开发中，预计将提升 vLLM 的吞吐量并降低延迟。

AI模型 vLLM DeepSeek DSpark 推理加速开源模型

推荐理由：vLLM 社区正在把 DeepSeek 的 DSpark 算法加进来，推理速度能再上一个台阶，用 vLLM 的朋友可以期待了。

原文

03:06

@koltregaskes@koltregaskes

79°

DeepSeek v4 将于 7 月中旬进入通用可用（GA）阶段，部分用户已收到相关邮件通知。该版本带来更多功能优化和性能改进。具体改进细节尚未完全公开，但用户可期待更优的模型能力。

AI模型 DeepSeek v4 DeepSeek 开源模型推理模型

推荐理由：DeepSeek v4 马上 GA 了，7 月中旬上线，性能有优化，想尝鲜的可以关注。

原文

6月29日

18:51

量子位@梦晨

DeepSeek创始人梁文锋受Claude系列模型强劲表现影响，决定启动新一轮融资。他认为不储备弹药将无法在竞争中立足。此轮融资将为DeepSeek后续研发和算力投入提供资金支持。

行业 DeepSeek 梁文锋 Claude 融资

推荐理由：梁文锋因为Claude的压力决定给DeepSeek融资了，说明大模型烧钱战还要继续打。

原文

16:27

Pandaily@contact@pandaily.com (Pandaily)

精选73°

DeepSeek 与北京大学联合开发的 DSpark 推理系统获得 PyTorch 核心维护者 Dmytro Dzhulgakov 的详细技术分析。他重点称赞 DSpark 的半并行草稿（semi-parallel drafting）机制，能提升推理吞吐量。分析指出该系统达到生产级工程水平（production-grade engineering），在特定负载下相比基线有显著加速。这一评测为开源推理系统提供了高含金量的第三方验证。

AI模型 DeepSeek DSpark PyTorch 推理模型开源模型

推荐理由：PyTorch 核心大佬亲自下场拆解 DeepSeek 的 DSpark，说它半并行草稿很牛、工程落地扎实，搞推理优化的必看。

原文

10:06

arXiv: DeepSeek@Aniket Deroy, Kripabandhu Ghosh, Saptarshi Ghosh

该论文提出一种受树状思维（Tree-of-Thoughts）启发的提取-抽象混合方法，用于法律判决摘要生成。实验使用DeepSeek和LLama两种LLM，对比了纯提取、纯抽象及混合式摘要。结果显示，混合式提示生成的摘要质量优于其他类型提示。

论文 DeepSeek LLama Tree-of-Thoughts 法律AI 文本摘要

推荐理由：这篇论文把思维树和提取-生成结合起来做法律摘要，用DeepSeek和Llama对比，发现混合方法效果更好。

原文

10:06

arXiv: DeepSeek@Lei Yu, Peng Wang, Jia Xu, Jingyuan Zhang, Xin Wang, Jiajia Ma, Li Yang, Changzhi Deng, Zenghua Wang, Fengjun Zhang

BashCoder-R1提出三阶段框架：连续预训练(CPT)专业化Bash范式、长思维链监督微调(L-CoT SFT)模拟风险意识推理、鲁棒性感知分组相对策略优化(R-GRPO)优化语法与鲁棒性。在包含952个真实任务(773单行,179多行)的BashBench基准上，单行/多行任务SyntaxPass达100.00%/94.97%，RobustPass达95.99%/79.33%，FullRate达90.04%/73.18%。相比最强基线DeepSeek-V3.2(推理)在FullRate上分别提升37.82%和20.18%。

AI模型 BashCoder-R1 BashBench DeepSeek 编程助手推理模型

推荐理由：BashCoder-R1用三阶段训练让AI写bash脚本更稳更可解释，在BashBench上比DeepSeek-V3.2完整率高出一大截。

原文

06:45

Clement Delangue@ClementDelangue

DeepSeek 推出加速模型集合，其中 Gemma-4-12B 可能包含视觉能力。该模型在其 12B 参数量级别中，本地运行性能显著优于同类竞品。该集合未包含 Qwen 3.5，推测因 DeepSeek 未采用线性注意力机制。

AI模型 DeepSeek Gemma-4-12B 加速模型本地模型视觉

推荐理由：DeepSeek 把 Gemma-4-12B 加速了，还带视觉，本地跑起来应该是同尺寸里最强的之一。

原文

00:21

berryxia@berryxia

精选73°

DeepSeek开源了DSpark投机解码框架，用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题，并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中，单用户生成速度比MTP-1基线快60-85%，不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。

AI模型 DeepSeek DSpark DeepSeek-V4 投机解码推理优化

推荐理由：DeepSeek开源了DSpark框架，能让你的V4模型推理提速60%以上，且不影响质量。它解决了投机解码在真实部署中的难题，已经稳定跑在生产环境。

原文

6月28日

16:36

Pandaily@contact@pandaily.com (Pandaily)

76°

北京大学与DeepSeek联合开源了投机解码框架DSpark，该框架无需修改模型即可将LLM推理速度提升60-85%。在严格延迟约束下，吞吐量增益最高达661%。DSpark通过高效的投机解码策略显著降低推理延迟。这一成果已在GitHub上开源。

AI模型 Peking University DeepSeek DSpark LLM 推理优化

推荐理由：北大和DeepSeek搞的DSpark，不用改模型就能让推理快80%，吞吐量翻好几倍，适合做部署的试试。

原文

14:34

量子位@林樾

百度在GitHub开源了全新OCR模型，模型名称暂未公开，但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管，提供预训练权重和API文档。

AI模型百度 OCR 开源模型 DeepSeek

推荐理由：百度搞了个能扫整本书的OCR，还开源了，做文档处理的可以试试。

原文

13:11

pandaily@contact@pandaily.com (Pandaily)

DeepSeek 发布 DSpark 推测解码框架，可将文本生成速度提升 80%。该框架优化推理效率，标志着 AI 竞争焦点从训练规模转向实际部署。DSpark 采用推测解码技术，通过小模型草稿加速大模型生成。

AI模型 DeepSeek DSpark 推理加速推测解码

推荐理由：DeepSeek 的 DSpark 框架让模型生成快八成，推理部署更省算力，搞推理优化的可以看看。

原文

13:09

pandaily@contact@pandaily.com (Pandaily)

精选73°

DeepSeek 在获 70 亿美元融资后发布首篇论文，提出 DSpark 推测解码框架，在无需额外训练的情况下将大模型生成速度提升 85%。该框架通过轻量级草稿模型配合验证机制加速推理，在多个基准测试中达到与原始模型相当的质量。DSpark 支持即插即用，可适配现有 DeepSeek 系列模型，显著降低延迟。

AI模型 DeepSeek DSpark 推理模型速度优化

推荐理由：DeepSeek 刚发了 DSpark，跑大模型生成能快 85%，还是即插即用的。搞推理加速的朋友可以关注。

原文

11:19

Geek@geekbb

有传闻称DeepSeek官方V4 API在2024年8月上线两周后，便开始使用氮气加速技术DSpark。该说法源自社区讨论，目前官方未确认。DSpark是DeepSeek自主研发的推理加速方案，可降低延迟和成本。若属实，则V4 API在发布后快速引入了性能优化。

AI产品 DeepSeek V4 DSpark 推理加速

推荐理由：听说DeepSeek V4 API悄悄用上DSpark加速了？上线才两周，这速度有点猛。

原文

01:07

marktechpost@Asif Razzaq

79°

DeepSeek开源了DSpark框架，通过将草稿模块附加到现有DeepSeek-V4权重上实现推测解码。它结合并行草稿骨干和轻量级马尔可夫头来减少后缀衰减，并加入基于置信度的调度验证，根据实时GPU负载调整检查token数量。离线测试中，接受长度相比DFlash和Eagle3提升16-31%；生产环境中每个用户生成速度比MTP-1基线提升57-85%，且无损。训练代码DeepSpec以MIT许可证开源。

AI模型 DSpark DeepSeek-V4 DeepSeek 推测解码推理加速

推荐理由：DeepSeek搞了个DSpark，让V4推理速度翻倍，开源还无损，适合高并发场景。

原文

00:49

Geek@geekbb

73°

DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩：LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%，超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文，并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署，引发社区期待。

AI模型 DeepSeek Pro Max 编码基准开源模型

推荐理由：DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6，分数拉满，但还没开放下载，先来围观一下。

原文

6月27日

16:27

Pandaily@contact@pandaily.com (Pandaily)

DeepSeek放弃了“不融资、不商业化”的立场，获得创纪录的70亿美元融资。该公司计划将所有部门的规模扩大一倍。同时推出Harness AI编码代理团队，与Anthropic的Claude Code直接竞争。

行业 DeepSeek Harness Claude Code Anthropic 编程助手

推荐理由：DeepSeek拿了70亿美金扩招一倍，新出的Harness AI编程工具对标Claude Code，AI竞争又升级了。

原文

16:21

16:21IT之家（博客/媒体）

美国企业 AI 账单持续失控，Lindy 公司此前每月调用 Anthropic 的 Claude 模型，账单超过所有员工工资。其 CEO Flo Crivello 本月初将 100% 流量切换至 DeepSeek，称未来几个月可节省数百万美元。Uber 也为部分 AI 工具设定了每月 1500 美元的分级支出上限。企业开始采用“模型路由”按任务匹配模型，不再将最贵的前沿模型用于所有场景。

行业 DeepSeek Claude Lindy AI账单企业AI支出

推荐理由：Lindy 公司从 Claude 全切到 DeepSeek，省下数百万美元，还立竿见影降成本。想控制 AI 账单的企业可以看看他们怎么做到的。

原文

15:51

15:51IT之家（博客/媒体）

76°

6月27日，北大与DeepSeek联合开源DSpark推理加速框架，已部署于DeepSeek-V4-Flash与V4-Pro预览版引擎。该框架相比单token推测解码基线MTP-1，在同等吞吐量下将单用户生成速度提升60%至85%。DSpark采用半自回归架构，在Qwen3-4B模型上平均接受长度比Eagle3提升约30.9%，比DFlash提升约16.3%。V4-Flash引擎实测中，80 token/s SLA下聚合吞吐量提升51%，120 token/s下提升661%。相关论文、训练代码及模型检查点已在GitHub DeepSpec项目开源。

AI模型 DeepSeek DSpark 北京大学推理模型开源模型

推荐理由：北大和DeepSeek开源了DSpark，能让高并发下大模型生成速度提升最多85%。想提速可以试试。

原文

6月26日

23:30

Decoder@Matthias Bastian

AI初创公司Lindy因AI成本超过人员成本，完全放弃Anthropic的Claude模型，转而采用DeepSeek。CEO Flo Crivello称此举是“为了企业生存”。这一变更预计每年节省数百万美元。事件反映了AI模型成本压力对初创公司决策的直接影响。

行业 Lindy DeepSeek Claude Anthropic AI成本优化

推荐理由：Lindy为了省钱，把Claude全换成了DeepSeek，省了几百万美元。这家公司说再不用DeepSeek就活不下去了——模型价格战就是这么现实。

原文

22:42

Gary Marcus@GaryMarcus

UBS调查显示，60%监控AI预算的企业已开始转向更便宜的模型和开源中国模型。企业面临极端账单，有用户每月花费高达35,000美元，团队超出配额200%，部分公司从5个AI内部工具削减至2个。企业通过模型路由策略，将简单任务分配给便宜模型，如Qwen、DeepSeek、MiniMax、GLM、Kimi，而保留高级模型用于推理、编程和长上下文任务。这些中国开源模型可以本地运行或通过云目录使用，符合企业成本曲线。

行业 UBS DeepSeek Qwen MiniMax 开源模型成本优化企业AI应用

推荐理由：大厂AI账单太高了，UBS说60%的企业已经在换更便宜的模型，像DeepSeek、Qwen这些中国开源模型成了新选择。想省钱的企业可以看看这个趋势。

原文

15:58

李继刚@lijigang_com

长期与Claude或DeepSeek等模型对话，你的语言风格会不自觉地模仿对方。重度使用后，说话会带出「Claude味儿」「DeepSeek味儿」。进行30天月度主题阅读，沉浸在同一主题的上下文中，能加深理解并切换看问题视角。

技巧 Claude DeepSeek 语言风格主题阅读

推荐理由：长期用Claude或DeepSeek聊天，说话会带味儿，还能用主题阅读切换视角，亲测有效

原文

09:59

pandaily@contact@pandaily.com (Pandaily)

DeepSeek 近期从工程效能平台 Harness 积极招募工程师，同时计划自建计算基础设施。此举标志其 AI 战略从依赖外部算力转向自建重型模式。公司旨在通过自主算力降低成本并提升效率。

行业 DeepSeek Harness AI基础设施算力人才招聘

推荐理由：DeepSeek 不满足于租别人的算力，开始自己建了。他们正猛挖 Harness 的工程师，从轻模式转向重资产，这可能会改变行业格局。

原文

09:30

arXiv: OpenAI@Haoxiang Sun, Tao Wang, Li Yuan, Jian Zhao, Jiancheng Lv

这篇来自 arXiv 的论文系统梳理了多模态大语言模型（MLLM）中视觉-语言感知的演变，首次将其视为统一的跨模态能力。论文提出了五阶段分类法，涵盖从早期方法到 OpenAI O-series、DeepSeek R-series 等最新模型带来的感知中心范式转变。它总结了每个阶段的代表性方法，并指出了开放挑战与通向通用智能的研究方向。该综述为 MLLM 感知研究提供了结构化理解与可操作的路线图。

论文 O-series R-series OpenAI DeepSeek 多模态大模型综述视觉语言

推荐理由：想搞懂多模态模型怎么从分开看图文进化成统一感知？这篇综述用五阶段框架讲清了O-series和R-series带来的转变，比碎片化教程系统得多。

原文

6月25日

14:56

14:56IT之家（博客/媒体）

胡润《2026全球独角兽榜》发布，全球独角兽达1603家，总价值54万亿元，较去年增长43%。美国以806家居首，中国381家第二。Anthropic以6.6万亿元价值跃居全球第一，OpenAI（5.8万亿元）第二，字节跳动（3.3万亿元）第三。新晋独角兽DeepSeek以3400亿元价值跻身前15名。

行业 Anthropic OpenAI 字节跳动 DeepSeek 独角兽

推荐理由：胡润榜单新鲜出炉：Anthropic超OpenAI成全球最贵独角兽，DeepSeek杀入前15，看看谁上榜了。

原文

13:45

marktechpost@Asif Razzaq

精选

百度开源Unlimited OCR，一个3B参数的MoE模型，能在单次前向推理中解析数十页文档。其突破性的Reference Sliding Window Attention (R-SWA)机制使KV缓存保持恒定，随着输出增长内存和延迟不变。模型在OmniDocBench v1.5基准上获得93.23分，比DeepSeek OCR基线高出6.22分。该模型采用MIT许可证开源。

AI模型 Unlimited OCR Baidu DeepSeek OmniDocBench OCR

推荐理由：百度开源了一个3B参数的OCR模型，能一口气解析几十页文档，KV缓存不膨胀，性能直接碾压DeepSeek。

原文

6月24日

16:09

16:09IT之家（博客/媒体）

特斯拉中国车机确认接入豆包大模型，语音交互升级进入落地阶段。内测版本2026.14.11的应用列表中已出现豆包AI助手入口。豆包负责车辆控制（空调、车窗、导航等），DeepSeek负责闲聊问答，分工明确。此前2024年8月特斯拉官网条款已披露将接入火山引擎Doubao和DeepSeek Chat。

AI产品特斯拉豆包 DeepSeek 火山引擎语音交互

推荐理由：特斯拉车主很快就能用豆包语音控车了，豆包管车控、DeepSeek管聊天，体验接近Grok。

原文

6月23日

14:25

OpenRouter@OpenRouterAI

OpenRouter 分享了 GLM 和 DeepSeek 两个模型家族的版本采用时间线图。数据展示了用户在不同版本之间的迁移趋势。图表包含 2 条回复、2 次转发、29 个喜欢和 3042 次查看。这反映了开源模型社区的版本使用动态。

行业 OpenRouter GLM DeepSeek 模型采用版本迁移

推荐理由：想了解 GLM 和 DeepSeek 用户都升级到了哪个版本？OpenRouter 这张图一目了然。

原文

12:04

arXiv: DeepSeek@Haifeng Wu, Srinivasan Manoharan, Fangbo Tu, Junhua Zhao, Jian Wan

精选

RLM-Cascade是一个代理层投机解码系统，在响应级别优化LLM API调用。它使用DeepSeek作为草稿模型、Opus作为验证模型，并通过轻量复杂度路由器选择路径。在Claude Code生产环境中，系统达到88.8%的草稿使用率，API成本相比直接使用Opus降低45.8%。P50延迟从3698毫秒降至2026毫秒，实现1.83倍加速。在20个Code/Math/Instruct任务基准上，RLM-Cascade通过率达100%，高于Opus的95%。

AI模型 RLM-Cascade DeepSeek Opus 投机解码智能体

推荐理由：这个系统把DeepSeek和Opus组合起来，用投机解码省了近一半API成本，还快了一倍，质量也有提升，而且开源可部署。

原文

08:05

berryxia@berryxia

百度开源了Unlimited OCR模型，采用R-SWA（参考滑动窗口注意力）机制，一次前向推理即可处理32K上下文的文档，数十页PDF无需分块。与传统逐页处理的OCR不同，其KV Cache大小恒定，不随长度增长。模型灵感源于人类抄书行为，仅维护近128个状态。技术报告核心贡献者中，技术总监YY疑为DeepSeek前员工。

AI模型 Unlimited OCR 百度 DeepSeek R-SWA 文档理解

推荐理由：百度开源的Unlimited OCR能一口气读完几十页PDF，不用切块，快又准。技术总监YY可能是DeepSeek出走的，有意思。

原文

6月22日

00:24

向阳乔木@vista8

DeepSeek Harness组作为新部门，正在大规模招聘三种职位：Harness研究员（实习/全职）、Harness工程师（实习/全职）、Harness产品经理（限全职）。招聘流程与其他部门一致，包含一轮笔试和三轮面试，终面由Tianyi Cui负责。职位空缺较大，简历可直接私信发送。

行业 DeepSeek Harness组 Tianyi Cui 招聘

推荐理由：DeepSeek Harness组在招研究员、工程师和产品经理，门槛不低但机会难得，想加入国产大模型核心团队的朋友可以试试看。

原文

6月21日

22:27

shao__meng@shao__meng

DeepSeek 新成立的 Harness 组由 Tianyi Cui 带队，目标远大、工作繁重，目前仍非常缺人。招聘共三种职位：Harness 研究员（实习/全职）、Harness 工程师（实习/全职）、Harness 产品经理（限全职）。招聘流程为一轮笔试加三轮面试，终面由 Tianyi Cui 负责。该组专注于 Agent Harness 研究和工程，职位空缺较大但门槛与 DS 其他组一致。

行业 DeepSeek Harness 招聘 Agent 工程

推荐理由：DeepSeek Harness 组在招人，研究员、工程师、产品经理都要，做 Agent Harness 的可以直接投简历。门槛不低但机会大。

原文

03:54

Suhail@Suhail

精选

Z.ai推出GLM-5.2开源模型，采用MIT开放权重。该模型支持1M上下文窗口，在Terminal-Bench 2.1基准上得分81.0，仅比Claude Opus 4.8低几分。Perplexity CEO此前指出，中国已拥有最强开源模型DeepSeek，且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。

AI模型 GLM-5.2 Z.ai DeepSeek 开源模型推理模型

推荐理由：Z.ai刚刚放出了GLM-5.2，MIT开源、100万上下文、跑分81.0，跟Claude Opus 4.8差距很小，做开源模型的得看看。

原文

6月19日

11:16

pandaily@contact@pandaily.com (Pandaily)

精选76°

DeepSeek完成其首次外部融资轮，募资超过500亿元人民币。本轮融资采用无投票权结构，战略投资者包括腾讯、宁德时代和京东等。这是国内AI公司最大规模的单轮融资之一，将用于支持其大模型研发与基础设施扩展。

行业 DeepSeek Tencent CATL JD.com 融资

推荐理由：DeepSeek刚融了500多亿，腾讯、宁德时代这些大厂都跟投了，说明行业对它技术路线的认可。

原文

00:37

Geek@geekbb

精选

一个名为 handoff 的开源工具让你在 Claude Code 或 Codex 会话中直接委托任务给 DeepSeek 等其他模型。典型用法是让 Claude 负责规划与审阅，DeepSeek 负责执行代码。这种方式能降低 API 成本，同时保持高开发效率。该方案已获得社区关注，相关仓库在 GitHub 上可见。

技巧 Claude DeepSeek Claude Code Codex 编程助手

推荐理由：想省钱又能干活？让 Claude 当项目经理、DeepSeek 当写代码的，这个工具帮你搞定。

原文

6月18日

22:03

22:03IT之家（博客/媒体）

79°

DeepSeek于本周完成首次外部融资，估值超过500亿美元（约3387.1亿元人民币）。公司一直拒绝外部融资，但在核心人才流失后启动融资计划。传闻创始人梁文锋向潜在资方提出承诺不挖走DeepSeek员工的要求。此前开发DeepSeek V3的罗福莉已转投小米，其团队推出的AI模型在基准测试中超越DeepSeek产品。

行业 DeepSeek 融资人才流失人才竞争

推荐理由：DeepSeek首次外部融资估值惊人，还要求投资人别挖自己人，这人才战打得挺有意思。

原文

15:52

15:52IT之家（博客/媒体）

DeepSeek 识图模式已在网页和 App 端正式上线，App 端标注“图片理解功能内测中”，网页端无此提示。该模式与快速模式、专家模式并列，支持用户上传图片让 DeepSeek 解读。其能力不仅是文字提取，还能理解图像内容。背后的多模态模型技术已于今年 4 月公开，核心框架名为“Thinking with Visual Primitives”。

AI产品 DeepSeek 识图模式多模态视觉理解 Thinking with Visual Primitives

推荐理由：DeepSeek 现在能识图了，App 和网页都能用，不只是 OCR，还能理解画面，背后有专门的多模态技术。

原文

09:21

arXiv: DeepSeek@Yifu Ding, Jiacheng Wang, Ge Yang, Yongcheng Jing, Jinyang Guo, Xianglong Liu, Dacheng Tao

精选

该论文针对混合专家(MoE)模型部署时内存和推理开销大的问题，提出一种结构剪枝框架。方法将剪枝比率分配转化为通道分数覆盖最大化问题，通过归因近似高效求解。在DeepSeek和Qwen MoE模型上实验，结合4-bit量化后，50%或25%结构化剪枝仍保持模型准确率。在Qwen3-30B-A3B上，内存占用减少5.27倍，优于现有基线。

论文 MoE 结构剪枝量化 DeepSeek Qwen

推荐理由：想省显存又怕掉精度？这篇论文用通道级剪枝加4-bit量化，把MoE模型体积砍到1/5还能保住性能，DeepSeek和Qwen都能用。

原文

08:03

08:03IT之家（博客/媒体）

DeepSeek于6月16日完成首轮外部融资，整体规模约510亿元，企业估值近4000亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、IDG资本及国家人工智能产业投资基金。融资将用于扩展AI基础设施、加强研发、员工股权激励及加快商业化进程。这是DeepSeek首次引入外部资本，估值在国内AI创业公司中处于领先水平。

行业 DeepSeek 腾讯宁德时代融资 AI基础设施

推荐理由：DeepSeek拿了510亿，估值4000亿，腾讯、宁德时代都投了，AI赛道钱景真猛

原文

00:35

Geek@geekbb

从2022年期待本地运行ChatGPT-3.5，到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期，社区感叹没有尽头。

行业 DeepSeek Qwen GLM Kimi 国产模型

推荐理由：这帖子把2022到2026国产模型进化史盘得清清楚楚，DeepSeek、Qwen、GLM、Kimi每月一个旗舰，本地部署清单都快十个版本了，AI发烧友必看。

原文

6月17日

23:33

23:33IT之家（博客/媒体）

91°

DeepSeek 于 2026 年 6 月 16 日完成首轮外部融资，融资规模约 510 亿元，企业估值近 4000 亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、Monolith 砺思资本、IDG 资本、正心谷投资、拾象科技以及国家人工智能产业投资基金。DeepSeek 成立于 2023 年 7 月 17 日，此前由母公司幻方量化全资支持，其量化业务巅峰期管理资产规模超 700 亿元。本轮融资将用于扩展 AI 基础设施、加强研发、员工股权激励及加快商业化。

行业 DeepSeek 腾讯宁德时代京东融资

推荐理由：DeepSeek 拿到 510 亿首轮融资，估值 4000 亿，腾讯、宁德时代、京东都投了，梁文锋亲自把关，五年锁定期只留长线资本。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？