06:48IT之家(博客/媒体)74°谷歌下一代模型 Gemini 3.5 Pro 原计划 6 月推出,现已推迟至 7 月。推迟原因是预留更多时间收集早期测试用户反馈,并对模型进行优化。该模型在长文本任务和驱动智能体两大方向实现性能提升。谷歌已将从 Flash 3.5 模型用户反馈中获得的经验融入 Gemini 3.5 Pro,尤其是针对 token 消耗过快的问题进行了改进。AI模型Gemini 3.5 Pro谷歌Flash 3.5智能体长文本推荐理由:谷歌把 Gemini 3.5 Pro 推迟到 7 月,就是为了打磨长文本和智能体能力,看看能不能追上 OpenAI 和 Anthropic。原文
14:55Claude@claudeai72°Claude Design 宣布将所有计划的 token 限制翻倍,用户现在可以创建更长的内容。这一变化适用于所有付费和免费计划,提升了模型处理长文本的能力。对于需要生成详细报告、长文档或复杂对话的用户来说,这是一个重要的改进。此举可能吸引更多创作者和开发者使用 Claude 进行深度工作。AI产品Claudetoken限制内容创作AI产品更新长文本推荐理由:做内容创作或长文档处理的用户,token 翻倍意味着更少的打断和更流畅的体验,值得立即体验。原文
21:36Moonshot AI: Kimi Blog(资讯)Moonshot AI 提出了一种名为 MoBA(混合块注意力)的新机制,旨在高效处理长文本序列。该机制将注意力计算划分为多个块,并动态选择相关块进行计算,从而大幅降低计算复杂度。实验表明,MoBA 在保持模型性能的同时,显著提升了长文本处理效率,尤其适用于需要处理超长上下文的场景。这一创新为长文本大模型的实际应用提供了新的解决方案。论文MoBA长文本注意力机制Moonshot AI效率优化1 个信源在谈推荐理由:MoBA 解决了长文本大模型计算效率低下的痛点,做 NLP 或大模型应用的开发者可以直接参考其设计思路,提升模型处理超长文本的能力。原文