06:35vLLM@vllm_projectvLLM 社区正在将 DeepSeek 的 DSpark 推测解码算法集成到 vLLM 推理引擎中。DSpark 是一种推测解码算法,能显著提升大语言模型的推理速度。该集成旨在为所有 vLLM 用户带来更快的推理性能,无需额外配置。目前社区正在积极开发中,预计将提升 vLLM 的吞吐量并降低延迟。AI模型vLLMDeepSeekDSpark推理加速开源模型推荐理由:vLLM 社区正在把 DeepSeek 的 DSpark 算法加进来,推理速度能再上一个台阶,用 vLLM 的朋友可以期待了。原文
03:06@koltregaskes@koltregaskes79°DeepSeek v4 将于 7 月中旬进入通用可用(GA)阶段,部分用户已收到相关邮件通知。该版本带来更多功能优化和性能改进。具体改进细节尚未完全公开,但用户可期待更优的模型能力。AI模型DeepSeek v4DeepSeek开源模型推理模型推荐理由:DeepSeek v4 马上 GA 了,7 月中旬上线,性能有优化,想尝鲜的可以关注。原文
18:51量子位@梦晨DeepSeek创始人梁文锋受Claude系列模型强劲表现影响,决定启动新一轮融资。他认为不储备弹药将无法在竞争中立足。此轮融资将为DeepSeek后续研发和算力投入提供资金支持。行业DeepSeek梁文锋Claude融资推荐理由:梁文锋因为Claude的压力决定给DeepSeek融资了,说明大模型烧钱战还要继续打。原文
16:27Pandaily@contact@pandaily.com (Pandaily)精选73°DeepSeek 与北京大学联合开发的 DSpark 推理系统获得 PyTorch 核心维护者 Dmytro Dzhulgakov 的详细技术分析。他重点称赞 DSpark 的半并行草稿(semi-parallel drafting)机制,能提升推理吞吐量。分析指出该系统达到生产级工程水平(production-grade engineering),在特定负载下相比基线有显著加速。这一评测为开源推理系统提供了高含金量的第三方验证。AI模型DeepSeekDSparkPyTorch推理模型开源模型推荐理由:PyTorch 核心大佬亲自下场拆解 DeepSeek 的 DSpark,说它半并行草稿很牛、工程落地扎实,搞推理优化的必看。原文
10:06arXiv: DeepSeek@Aniket Deroy, Kripabandhu Ghosh, Saptarshi Ghosh该论文提出一种受树状思维(Tree-of-Thoughts)启发的提取-抽象混合方法,用于法律判决摘要生成。实验使用DeepSeek和LLama两种LLM,对比了纯提取、纯抽象及混合式摘要。结果显示,混合式提示生成的摘要质量优于其他类型提示。论文DeepSeekLLamaTree-of-Thoughts法律AI文本摘要推荐理由:这篇论文把思维树和提取-生成结合起来做法律摘要,用DeepSeek和Llama对比,发现混合方法效果更好。原文
10:06arXiv: DeepSeek@Lei Yu, Peng Wang, Jia Xu, Jingyuan Zhang, Xin Wang, Jiajia Ma, Li Yang, Changzhi Deng, Zenghua Wang, Fengjun ZhangBashCoder-R1提出三阶段框架:连续预训练(CPT)专业化Bash范式、长思维链监督微调(L-CoT SFT)模拟风险意识推理、鲁棒性感知分组相对策略优化(R-GRPO)优化语法与鲁棒性。在包含952个真实任务(773单行,179多行)的BashBench基准上,单行/多行任务SyntaxPass达100.00%/94.97%,RobustPass达95.99%/79.33%,FullRate达90.04%/73.18%。相比最强基线DeepSeek-V3.2(推理)在FullRate上分别提升37.82%和20.18%。AI模型BashCoder-R1BashBenchDeepSeek编程助手推理模型推荐理由:BashCoder-R1用三阶段训练让AI写bash脚本更稳更可解释,在BashBench上比DeepSeek-V3.2完整率高出一大截。原文
06:45Clement Delangue@ClementDelangueDeepSeek 推出加速模型集合,其中 Gemma-4-12B 可能包含视觉能力。该模型在其 12B 参数量级别中,本地运行性能显著优于同类竞品。该集合未包含 Qwen 3.5,推测因 DeepSeek 未采用线性注意力机制。AI模型DeepSeekGemma-4-12B加速模型本地模型视觉推荐理由:DeepSeek 把 Gemma-4-12B 加速了,还带视觉,本地跑起来应该是同尺寸里最强的之一。原文
00:21berryxia@berryxia精选73°DeepSeek开源了DSpark投机解码框架,用于推理优化。DSpark通过并行backbone加顺序Markov head解决传统投机解码的后缀衰减问题,并引入置信度调度和负载感知调度器。在DeepSeek-V4生产环境中,单用户生成速度比MTP-1基线快60-85%,不同场景吞吐提升1.5x到5x。开源内容包括DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型checkpoint以及MIT协议的DeepSpec训练代码。AI模型DeepSeekDSparkDeepSeek-V4投机解码推理优化推荐理由:DeepSeek开源了DSpark框架,能让你的V4模型推理提速60%以上,且不影响质量。它解决了投机解码在真实部署中的难题,已经稳定跑在生产环境。原文
16:36Pandaily@contact@pandaily.com (Pandaily)76°北京大学与DeepSeek联合开源了投机解码框架DSpark,该框架无需修改模型即可将LLM推理速度提升60-85%。在严格延迟约束下,吞吐量增益最高达661%。DSpark通过高效的投机解码策略显著降低推理延迟。这一成果已在GitHub上开源。AI模型Peking UniversityDeepSeekDSparkLLM推理优化推荐理由:北大和DeepSeek搞的DSpark,不用改模型就能让推理快80%,吞吐量翻好几倍,适合做部署的试试。原文
14:34量子位@林樾百度在GitHub开源了全新OCR模型,模型名称暂未公开,但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管,提供预训练权重和API文档。AI模型百度OCR开源模型DeepSeek推荐理由:百度搞了个能扫整本书的OCR,还开源了,做文档处理的可以试试。原文
13:11pandaily@contact@pandaily.com (Pandaily)DeepSeek 发布 DSpark 推测解码框架,可将文本生成速度提升 80%。该框架优化推理效率,标志着 AI 竞争焦点从训练规模转向实际部署。DSpark 采用推测解码技术,通过小模型草稿加速大模型生成。AI模型DeepSeekDSpark推理加速推测解码推荐理由:DeepSeek 的 DSpark 框架让模型生成快八成,推理部署更省算力,搞推理优化的可以看看。原文
13:09pandaily@contact@pandaily.com (Pandaily)精选73°DeepSeek 在获 70 亿美元融资后发布首篇论文,提出 DSpark 推测解码框架,在无需额外训练的情况下将大模型生成速度提升 85%。该框架通过轻量级草稿模型配合验证机制加速推理,在多个基准测试中达到与原始模型相当的质量。DSpark 支持即插即用,可适配现有 DeepSeek 系列模型,显著降低延迟。AI模型DeepSeekDSpark推理模型速度优化推荐理由:DeepSeek 刚发了 DSpark,跑大模型生成能快 85%,还是即插即用的。搞推理加速的朋友可以关注。原文
11:19Geek@geekbb有传闻称DeepSeek官方V4 API在2024年8月上线两周后,便开始使用氮气加速技术DSpark。该说法源自社区讨论,目前官方未确认。DSpark是DeepSeek自主研发的推理加速方案,可降低延迟和成本。若属实,则V4 API在发布后快速引入了性能优化。AI产品DeepSeekV4DSpark推理加速推荐理由:听说DeepSeek V4 API悄悄用上DSpark加速了?上线才两周,这速度有点猛。原文
01:07marktechpost@Asif Razzaq79°DeepSeek开源了DSpark框架,通过将草稿模块附加到现有DeepSeek-V4权重上实现推测解码。它结合并行草稿骨干和轻量级马尔可夫头来减少后缀衰减,并加入基于置信度的调度验证,根据实时GPU负载调整检查token数量。离线测试中,接受长度相比DFlash和Eagle3提升16-31%;生产环境中每个用户生成速度比MTP-1基线提升57-85%,且无损。训练代码DeepSpec以MIT许可证开源。AI模型DSparkDeepSeek-V4DeepSeek推测解码推理加速1 个信源在谈推荐理由:DeepSeek搞了个DSpark,让V4推理速度翻倍,开源还无损,适合高并发场景。原文
00:49Geek@geekbb73°DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩:LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%,超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文,并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署,引发社区期待。AI模型DeepSeekPro Max编码基准开源模型推荐理由:DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6,分数拉满,但还没开放下载,先来围观一下。原文
16:27Pandaily@contact@pandaily.com (Pandaily)DeepSeek放弃了“不融资、不商业化”的立场,获得创纪录的70亿美元融资。该公司计划将所有部门的规模扩大一倍。同时推出Harness AI编码代理团队,与Anthropic的Claude Code直接竞争。行业DeepSeekHarnessClaude CodeAnthropic编程助手10 个信源在谈推荐理由:DeepSeek拿了70亿美金扩招一倍,新出的Harness AI编程工具对标Claude Code,AI竞争又升级了。原文
16:21IT之家(博客/媒体)美国企业 AI 账单持续失控,Lindy 公司此前每月调用 Anthropic 的 Claude 模型,账单超过所有员工工资。其 CEO Flo Crivello 本月初将 100% 流量切换至 DeepSeek,称未来几个月可节省数百万美元。Uber 也为部分 AI 工具设定了每月 1500 美元的分级支出上限。企业开始采用“模型路由”按任务匹配模型,不再将最贵的前沿模型用于所有场景。行业DeepSeekClaudeLindyAI账单企业AI支出10 个信源在谈推荐理由:Lindy 公司从 Claude 全切到 DeepSeek,省下数百万美元,还立竿见影降成本。想控制 AI 账单的企业可以看看他们怎么做到的。原文
15:51IT之家(博客/媒体)76°6月27日,北大与DeepSeek联合开源DSpark推理加速框架,已部署于DeepSeek-V4-Flash与V4-Pro预览版引擎。该框架相比单token推测解码基线MTP-1,在同等吞吐量下将单用户生成速度提升60%至85%。DSpark采用半自回归架构,在Qwen3-4B模型上平均接受长度比Eagle3提升约30.9%,比DFlash提升约16.3%。V4-Flash引擎实测中,80 token/s SLA下聚合吞吐量提升51%,120 token/s下提升661%。相关论文、训练代码及模型检查点已在GitHub DeepSpec项目开源。AI模型DeepSeekDSpark北京大学推理模型开源模型1 个信源在谈推荐理由:北大和DeepSeek开源了DSpark,能让高并发下大模型生成速度提升最多85%。想提速可以试试。原文
23:30Decoder@Matthias BastianAI初创公司Lindy因AI成本超过人员成本,完全放弃Anthropic的Claude模型,转而采用DeepSeek。CEO Flo Crivello称此举是“为了企业生存”。这一变更预计每年节省数百万美元。事件反映了AI模型成本压力对初创公司决策的直接影响。行业LindyDeepSeekClaudeAnthropicAI成本优化10 个信源在谈推荐理由:Lindy为了省钱,把Claude全换成了DeepSeek,省了几百万美元。这家公司说再不用DeepSeek就活不下去了——模型价格战就是这么现实。原文
22:42Gary Marcus@GaryMarcusUBS调查显示,60%监控AI预算的企业已开始转向更便宜的模型和开源中国模型。企业面临极端账单,有用户每月花费高达35,000美元,团队超出配额200%,部分公司从5个AI内部工具削减至2个。企业通过模型路由策略,将简单任务分配给便宜模型,如Qwen、DeepSeek、MiniMax、GLM、Kimi,而保留高级模型用于推理、编程和长上下文任务。这些中国开源模型可以本地运行或通过云目录使用,符合企业成本曲线。行业UBSDeepSeekQwenMiniMax开源模型成本优化企业AI应用推荐理由:大厂AI账单太高了,UBS说60%的企业已经在换更便宜的模型,像DeepSeek、Qwen这些中国开源模型成了新选择。想省钱的企业可以看看这个趋势。原文
15:58李继刚@lijigang_com长期与Claude或DeepSeek等模型对话,你的语言风格会不自觉地模仿对方。重度使用后,说话会带出「Claude味儿」「DeepSeek味儿」。进行30天月度主题阅读,沉浸在同一主题的上下文中,能加深理解并切换看问题视角。技巧ClaudeDeepSeek语言风格主题阅读推荐理由:长期用Claude或DeepSeek聊天,说话会带味儿,还能用主题阅读切换视角,亲测有效原文
09:59pandaily@contact@pandaily.com (Pandaily)DeepSeek 近期从工程效能平台 Harness 积极招募工程师,同时计划自建计算基础设施。此举标志其 AI 战略从依赖外部算力转向自建重型模式。公司旨在通过自主算力降低成本并提升效率。行业DeepSeekHarnessAI基础设施算力人才招聘推荐理由:DeepSeek 不满足于租别人的算力,开始自己建了。他们正猛挖 Harness 的工程师,从轻模式转向重资产,这可能会改变行业格局。原文
09:30arXiv: OpenAI@Haoxiang Sun, Tao Wang, Li Yuan, Jian Zhao, Jiancheng Lv这篇来自 arXiv 的论文系统梳理了多模态大语言模型(MLLM)中视觉-语言感知的演变,首次将其视为统一的跨模态能力。论文提出了五阶段分类法,涵盖从早期方法到 OpenAI O-series、DeepSeek R-series 等最新模型带来的感知中心范式转变。它总结了每个阶段的代表性方法,并指出了开放挑战与通向通用智能的研究方向。该综述为 MLLM 感知研究提供了结构化理解与可操作的路线图。论文O-seriesR-seriesOpenAIDeepSeek多模态大模型综述视觉语言7 个信源在谈推荐理由:想搞懂多模态模型怎么从分开看图文进化成统一感知?这篇综述用五阶段框架讲清了O-series和R-series带来的转变,比碎片化教程系统得多。原文
14:56IT之家(博客/媒体)胡润《2026全球独角兽榜》发布,全球独角兽达1603家,总价值54万亿元,较去年增长43%。美国以806家居首,中国381家第二。Anthropic以6.6万亿元价值跃居全球第一,OpenAI(5.8万亿元)第二,字节跳动(3.3万亿元)第三。新晋独角兽DeepSeek以3400亿元价值跻身前15名。行业AnthropicOpenAI字节跳动DeepSeek独角兽10 个信源在谈推荐理由:胡润榜单新鲜出炉:Anthropic超OpenAI成全球最贵独角兽,DeepSeek杀入前15,看看谁上榜了。原文
13:45marktechpost@Asif Razzaq精选百度开源Unlimited OCR,一个3B参数的MoE模型,能在单次前向推理中解析数十页文档。其突破性的Reference Sliding Window Attention (R-SWA)机制使KV缓存保持恒定,随着输出增长内存和延迟不变。模型在OmniDocBench v1.5基准上获得93.23分,比DeepSeek OCR基线高出6.22分。该模型采用MIT许可证开源。AI模型Unlimited OCRBaiduDeepSeekOmniDocBenchOCR5 个信源在谈推荐理由:百度开源了一个3B参数的OCR模型,能一口气解析几十页文档,KV缓存不膨胀,性能直接碾压DeepSeek。原文
16:09IT之家(博客/媒体)特斯拉中国车机确认接入豆包大模型,语音交互升级进入落地阶段。内测版本2026.14.11的应用列表中已出现豆包AI助手入口。豆包负责车辆控制(空调、车窗、导航等),DeepSeek负责闲聊问答,分工明确。此前2024年8月特斯拉官网条款已披露将接入火山引擎Doubao和DeepSeek Chat。AI产品特斯拉豆包DeepSeek火山引擎语音交互1 个信源在谈推荐理由:特斯拉车主很快就能用豆包语音控车了,豆包管车控、DeepSeek管聊天,体验接近Grok。原文
14:25OpenRouter@OpenRouterAIOpenRouter 分享了 GLM 和 DeepSeek 两个模型家族的版本采用时间线图。数据展示了用户在不同版本之间的迁移趋势。图表包含 2 条回复、2 次转发、29 个喜欢和 3042 次查看。这反映了开源模型社区的版本使用动态。行业OpenRouterGLMDeepSeek模型采用版本迁移推荐理由:想了解 GLM 和 DeepSeek 用户都升级到了哪个版本?OpenRouter 这张图一目了然。原文
12:04arXiv: DeepSeek@Haifeng Wu, Srinivasan Manoharan, Fangbo Tu, Junhua Zhao, Jian Wan精选RLM-Cascade是一个代理层投机解码系统,在响应级别优化LLM API调用。它使用DeepSeek作为草稿模型、Opus作为验证模型,并通过轻量复杂度路由器选择路径。在Claude Code生产环境中,系统达到88.8%的草稿使用率,API成本相比直接使用Opus降低45.8%。P50延迟从3698毫秒降至2026毫秒,实现1.83倍加速。在20个Code/Math/Instruct任务基准上,RLM-Cascade通过率达100%,高于Opus的95%。AI模型RLM-CascadeDeepSeekOpus投机解码智能体推荐理由:这个系统把DeepSeek和Opus组合起来,用投机解码省了近一半API成本,还快了一倍,质量也有提升,而且开源可部署。原文
08:05berryxia@berryxia百度开源了Unlimited OCR模型,采用R-SWA(参考滑动窗口注意力)机制,一次前向推理即可处理32K上下文的文档,数十页PDF无需分块。与传统逐页处理的OCR不同,其KV Cache大小恒定,不随长度增长。模型灵感源于人类抄书行为,仅维护近128个状态。技术报告核心贡献者中,技术总监YY疑为DeepSeek前员工。AI模型Unlimited OCR百度DeepSeekR-SWA文档理解6 个信源在谈推荐理由:百度开源的Unlimited OCR能一口气读完几十页PDF,不用切块,快又准。技术总监YY可能是DeepSeek出走的,有意思。原文
00:24向阳乔木@vista8DeepSeek Harness组作为新部门,正在大规模招聘三种职位:Harness研究员(实习/全职)、Harness工程师(实习/全职)、Harness产品经理(限全职)。招聘流程与其他部门一致,包含一轮笔试和三轮面试,终面由Tianyi Cui负责。职位空缺较大,简历可直接私信发送。行业DeepSeekHarness组Tianyi Cui招聘推荐理由:DeepSeek Harness组在招研究员、工程师和产品经理,门槛不低但机会难得,想加入国产大模型核心团队的朋友可以试试看。原文
22:27shao__meng@shao__mengDeepSeek 新成立的 Harness 组由 Tianyi Cui 带队,目标远大、工作繁重,目前仍非常缺人。招聘共三种职位:Harness 研究员(实习/全职)、Harness 工程师(实习/全职)、Harness 产品经理(限全职)。招聘流程为一轮笔试加三轮面试,终面由 Tianyi Cui 负责。该组专注于 Agent Harness 研究和工程,职位空缺较大但门槛与 DS 其他组一致。行业DeepSeekHarness招聘Agent工程推荐理由:DeepSeek Harness 组在招人,研究员、工程师、产品经理都要,做 Agent Harness 的可以直接投简历。门槛不低但机会大。原文
03:54Suhail@Suhail精选Z.ai推出GLM-5.2开源模型,采用MIT开放权重。该模型支持1M上下文窗口,在Terminal-Bench 2.1基准上得分81.0,仅比Claude Opus 4.8低几分。Perplexity CEO此前指出,中国已拥有最强开源模型DeepSeek,且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。AI模型GLM-5.2Z.aiDeepSeek开源模型推理模型推荐理由:Z.ai刚刚放出了GLM-5.2,MIT开源、100万上下文、跑分81.0,跟Claude Opus 4.8差距很小,做开源模型的得看看。原文
11:16pandaily@contact@pandaily.com (Pandaily)精选76°DeepSeek完成其首次外部融资轮,募资超过500亿元人民币。本轮融资采用无投票权结构,战略投资者包括腾讯、宁德时代和京东等。这是国内AI公司最大规模的单轮融资之一,将用于支持其大模型研发与基础设施扩展。行业DeepSeekTencentCATLJD.com融资推荐理由:DeepSeek刚融了500多亿,腾讯、宁德时代这些大厂都跟投了,说明行业对它技术路线的认可。原文
00:37Geek@geekbb精选一个名为 handoff 的开源工具让你在 Claude Code 或 Codex 会话中直接委托任务给 DeepSeek 等其他模型。典型用法是让 Claude 负责规划与审阅,DeepSeek 负责执行代码。这种方式能降低 API 成本,同时保持高开发效率。该方案已获得社区关注,相关仓库在 GitHub 上可见。技巧ClaudeDeepSeekClaude CodeCodex编程助手推荐理由:想省钱又能干活?让 Claude 当项目经理、DeepSeek 当写代码的,这个工具帮你搞定。原文
22:03IT之家(博客/媒体)79°DeepSeek于本周完成首次外部融资,估值超过500亿美元(约3387.1亿元人民币)。公司一直拒绝外部融资,但在核心人才流失后启动融资计划。传闻创始人梁文锋向潜在资方提出承诺不挖走DeepSeek员工的要求。此前开发DeepSeek V3的罗福莉已转投小米,其团队推出的AI模型在基准测试中超越DeepSeek产品。行业DeepSeek融资人才流失人才竞争推荐理由:DeepSeek首次外部融资估值惊人,还要求投资人别挖自己人,这人才战打得挺有意思。原文
15:52IT之家(博客/媒体)DeepSeek 识图模式已在网页和 App 端正式上线,App 端标注“图片理解功能内测中”,网页端无此提示。该模式与快速模式、专家模式并列,支持用户上传图片让 DeepSeek 解读。其能力不仅是文字提取,还能理解图像内容。背后的多模态模型技术已于今年 4 月公开,核心框架名为“Thinking with Visual Primitives”。AI产品DeepSeek识图模式多模态视觉理解Thinking with Visual Primitives推荐理由:DeepSeek 现在能识图了,App 和网页都能用,不只是 OCR,还能理解画面,背后有专门的多模态技术。原文
09:21arXiv: DeepSeek@Yifu Ding, Jiacheng Wang, Ge Yang, Yongcheng Jing, Jinyang Guo, Xianglong Liu, Dacheng Tao精选该论文针对混合专家(MoE)模型部署时内存和推理开销大的问题,提出一种结构剪枝框架。方法将剪枝比率分配转化为通道分数覆盖最大化问题,通过归因近似高效求解。在DeepSeek和Qwen MoE模型上实验,结合4-bit量化后,50%或25%结构化剪枝仍保持模型准确率。在Qwen3-30B-A3B上,内存占用减少5.27倍,优于现有基线。论文MoE结构剪枝量化DeepSeekQwen推荐理由:想省显存又怕掉精度?这篇论文用通道级剪枝加4-bit量化,把MoE模型体积砍到1/5还能保住性能,DeepSeek和Qwen都能用。原文
08:03IT之家(博客/媒体)DeepSeek于6月16日完成首轮外部融资,整体规模约510亿元,企业估值近4000亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、IDG资本及国家人工智能产业投资基金。融资将用于扩展AI基础设施、加强研发、员工股权激励及加快商业化进程。这是DeepSeek首次引入外部资本,估值在国内AI创业公司中处于领先水平。行业DeepSeek腾讯宁德时代融资AI基础设施推荐理由:DeepSeek拿了510亿,估值4000亿,腾讯、宁德时代都投了,AI赛道钱景真猛原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
23:33IT之家(博客/媒体)91°DeepSeek 于 2026 年 6 月 16 日完成首轮外部融资,融资规模约 510 亿元,企业估值近 4000 亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、Monolith 砺思资本、IDG 资本、正心谷投资、拾象科技以及国家人工智能产业投资基金。DeepSeek 成立于 2023 年 7 月 17 日,此前由母公司幻方量化全资支持,其量化业务巅峰期管理资产规模超 700 亿元。本轮融资将用于扩展 AI 基础设施、加强研发、员工股权激励及加快商业化。行业DeepSeek腾讯宁德时代京东融资推荐理由:DeepSeek 拿到 510 亿首轮融资,估值 4000 亿,腾讯、宁德时代、京东都投了,梁文锋亲自把关,五年锁定期只留长线资本。原文