01:07marktechpost@Asif Razzaq79°DeepSeek开源了DSpark框架,通过将草稿模块附加到现有DeepSeek-V4权重上实现推测解码。它结合并行草稿骨干和轻量级马尔可夫头来减少后缀衰减,并加入基于置信度的调度验证,根据实时GPU负载调整检查token数量。离线测试中,接受长度相比DFlash和Eagle3提升16-31%;生产环境中每个用户生成速度比MTP-1基线提升57-85%,且无损。训练代码DeepSpec以MIT许可证开源。AI模型DSparkDeepSeek-V4DeepSeek推测解码推理加速1 个信源在谈推荐理由:DeepSeek搞了个DSpark,让V4推理速度翻倍,开源还无损,适合高并发场景。原文
17:27IT之家(博客/媒体)腾讯云公告,DeepSeek-V3.2模型将于2026年7月16日00:00下线,届时不再提供接入服务。未迁移用户将由系统自动切换至DeepSeek最新模型。官方推荐迁移至能力更优的DeepSeek-V4系列模型。此前6月3日腾讯云已下调DeepSeek-V4系列价格,其中V4-Pro推理输入与输出价格降幅达75%,缓存命中价格降幅达97.5%,V4-Flash缓存命中价格降幅达90%。行业腾讯云DeepSeek-V3.2DeepSeek-V4模型迁移API服务1 个信源在谈推荐理由:腾讯云要停用DeepSeek-V3.2了,赶紧迁移到V4,价格还降了75%。原文
00:15IT之家(博客/媒体)腾讯云智能体开发平台宣布自2026年6月3日起,对DeepSeek-V4系列模型进行价格下调。其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,缓存命中价格降幅高达97.5%;DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。该系列模型总参数达1.6万亿,采用混合专家架构,原生支持100万Token上下文长度。此次降价是腾讯云在平台接入层面的进一步调整,此前DeepSeek官方已于5月23日宣布V4-Pro API永久降价。AI产品腾讯云DeepSeek-V4模型降价智能体API2 个信源在谈推荐理由:腾讯云大幅降低DeepSeek-V4系列模型调用成本,做AI应用开发或智能体集成的团队可以直接降低推理成本,缓存命中价格降幅高达97.5%,高频调用场景尤其划算,建议开发者抓紧调整预算。原文
15:39pandaily@contact@pandaily.com (Pandaily)精选76°Sphere AI Lab 开源了 Orbit,一个强化学习后训练框架,支持在单个 8×B200 节点上对万亿参数模型(如 DeepSeek-V4)进行微调。该框架通过优化内存和计算效率,大幅降低了大规模模型训练的门槛,使得资源有限的团队也能进行高效的后训练。Orbit 的发布解决了万亿参数模型训练需要大规模集群的痛点,有望推动更多研究者和开发者参与大模型的后训练优化。AI模型开源/仓库强化学习后训练万亿参数DeepSeek-V4推荐理由:Orbit 让万亿参数模型的后训练不再依赖大规模集群,做 RL 微调或大模型优化的团队可以直接在单节点上跑 DeepSeek-V4,建议试试这个开源方案。原文
08:40IT之家(博客/媒体)努比亚宣布,搭载星云AIOS 2.0的机型(包括Z60、Z70、Z80系列)现已支持DeepSeek-V4模型,无需更新系统版本即可使用。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上领先,已于今年4月开源。该功能覆盖广泛,用户可立即体验。AI产品努比亚星云AIOSDeepSeek-V4手机AI百万上下文推荐理由:努比亚用户无需等待系统更新就能用上百万上下文AI模型,做深度文档分析或复杂任务的用户可以直接试试,体验升级立竿见影。原文