全部 AI 动态 · AI 热点

6月25日

06:48

06:48IT之家（博客/媒体）

74°

谷歌下一代模型 Gemini 3.5 Pro 原计划 6 月推出，现已推迟至 7 月。推迟原因是预留更多时间收集早期测试用户反馈，并对模型进行优化。该模型在长文本任务和驱动智能体两大方向实现性能提升。谷歌已将从 Flash 3.5 模型用户反馈中获得的经验融入 Gemini 3.5 Pro，尤其是针对 token 消耗过快的问题进行了改进。

AI模型 Gemini 3.5 Pro 谷歌 Flash 3.5 智能体长文本

推荐理由：谷歌把 Gemini 3.5 Pro 推迟到 7 月，就是为了打磨长文本和智能体能力，看看能不能追上 OpenAI 和 Anthropic。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月19日

14:55

14:55

Claude@claudeai

72°

Claude Design 宣布将所有计划的 token 限制翻倍，用户现在可以创建更长的内容。这一变化适用于所有付费和免费计划，提升了模型处理长文本的能力。对于需要生成详细报告、长文档或复杂对话的用户来说，这是一个重要的改进。此举可能吸引更多创作者和开发者使用 Claude 进行深度工作。

AI产品 Claude token限制内容创作 AI产品更新长文本

推荐理由：做内容创作或长文档处理的用户，token 翻倍意味着更少的打断和更流畅的体验，值得立即体验。

5月13日

21:36

21:36Moonshot AI: Kimi Blog（资讯）

Moonshot AI 提出了一种名为 MoBA（混合块注意力）的新机制，旨在高效处理长文本序列。该机制将注意力计算划分为多个块，并动态选择相关块进行计算，从而大幅降低计算复杂度。实验表明，MoBA 在保持模型性能的同时，显著提升了长文本处理效率，尤其适用于需要处理超长上下文的场景。这一创新为长文本大模型的实际应用提供了新的解决方案。

论文 MoBA 长文本注意力机制 Moonshot AI 效率优化

推荐理由：MoBA 解决了长文本大模型计算效率低下的痛点，做 NLP 或大模型应用的开发者可以直接参考其设计思路，提升模型处理超长文本的能力。