全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

04:52

04:52Anthropic: Newsroom（资讯）

72°

Anthropic 于 2026 年 6 月 9 日宣布推出下一代 AI 模型 Claude Fable 5 和 Claude Mythos 5。这两个模型分别针对高难度知识工作和复杂编程问题进行了优化。Fable 5 在推理、多步分析和创造性问题解决上表现突出，而 Mythos 5 则专注于代码生成、调试和架构设计。此次发布标志着 Anthropic 在专业领域的深度布局，旨在为研究人员、工程师和高级开发者提供更强大的工具。

AI模型 Anthropic Claude Fable 5 Claude Mythos 5 推理模型编程助手

推荐理由：Anthropic 将模型细分为知识工作与编程专用版本，解决了通用模型在专业场景下不够深入的问题。做研究、写复杂代码的团队可以直接升级工作流，值得关注。

5月13日

21:36

21:36Moonshot AI: Kimi Blog（资讯）

70°

Moonshot AI 正式开源了其最新的智能体模型 Kimi K2，该模型在多个基准测试中表现优异，尤其在代码生成、工具使用和复杂推理任务上超越了 GPT-4 和 Claude 3.5。K2 采用混合专家架构，拥有 1.5 万亿参数，但通过稀疏激活机制实现了高效推理。此次开源不仅提供了模型权重，还包括了训练代码和详细的技术报告，旨在推动智能体技术的民主化。对于开发者而言，K2 的开放意味着可以基于其强大的工具调用能力构建更自主的 AI 应用。

AI模型智能体开源/仓库推理模型 Moonshot Kimi K2

推荐理由：Kimi K2 开源让开发者直接获得了一个在工具使用和推理上超越 GPT-4 的智能体模型，做 AI 应用和自动化流程的团队建议立即上手试试。

21:35

21:35Moonshot AI: Kimi Blog（资讯）

70°

月之暗面正式发布了 Kimi 长思考模型 API，该模型具备深度推理能力，能够处理复杂任务并输出详细思考过程。开发者可以通过 API 调用，在应用中集成 Kimi 的思考能力，提升问答质量和逻辑性。该模型在数学、编程、逻辑推理等场景表现突出，支持多轮对话和长上下文。此次发布标志着 Kimi 从对话产品向平台化服务迈出重要一步。

AI产品 Kimi 长思考模型 API 推理模型月之暗面

推荐理由：Kimi 长思考模型 API 让开发者能直接调用深度推理能力，做复杂问答或逻辑分析的应用团队值得接入试试。

21:35

21:35Moonshot AI: Kimi Blog（资讯）

Kimi 发布了 K2 Thinking 模型并开源，该模型在 Agent 和推理能力上实现显著提升。K2 Thinking 基于 K2 架构，通过强化学习优化了长链推理和多步决策能力，在多个基准测试中表现优异。开源版本允许开发者自由部署和二次开发，降低了使用门槛。这一发布标志着 Kimi 在 Agent 和推理模型领域的持续投入，为开发者和企业提供了更强大的工具。

AI模型 Kimi K2 Thinking 开源/仓库推理模型智能体

推荐理由：K2 Thinking 的开源让 Agent 和推理能力更强的模型触手可及，做智能体或复杂推理应用的开发者可以直接下载试用，降低自研成本。

21:35

21:35Anthropic: Newsroom（资讯）

85°

Anthropic 于 2026 年 4 月 16 日发布了 Claude Opus 4.7，这是其最新旗舰模型。该模型在编程、智能体、视觉和多步骤任务上性能显著提升，尤其在需要深度推理和一致性的复杂工作中表现更佳。Opus 4.7 的推出进一步巩固了 Anthropic 在高端 AI 模型领域的竞争力，为开发者和企业用户提供了更可靠的自动化解决方案。

AI模型 Claude Opus 4.7 推理模型编程助手智能体 Anthropic

推荐理由：做复杂编程和智能体开发的团队终于有了更靠谱的选择——Opus 4.7 在多步骤任务上的一致性提升明显，建议直接上手测试。

12:33

12:33Claude: Blog（资讯）

精选

Claude Opus 是Anthropic最新旗舰模型，在MMLU基准测试中达到90.2%，在HumanEval代码生成测试中达到90.1%，均超越GPT-4。它支持200K token上下文窗口，在复杂推理、多语言对话和编程等任务上表现领先。该模型采用Constitutional AI训练方法，提升了安全性和可控性。

AI模型 Claude Opus Anthropic MMLU 编程助手推理模型

推荐理由：推理编程都碾压，性价比高

12:33

12:33Claude: Blog（资讯）

精选

Anthropic推出Claude Haiku，这是其Claude 3系列中最快速且成本最低的模型。Haiku每秒可处理100余个token，延迟低至150毫秒。在MMLU基准测试中得分为75.4，上下文窗口达100K tokens。定价为每百万输入token 0.25美元，每百万输出token 1.25美元。

AI模型 Claude Haiku Anthropic 推理模型轻量级

推荐理由：轻量高性价比的Claude

12:33

12:33MiniMax: News（资讯）

精选

MiniMax 发布了新一代通用多模态模型 Hailuo 02。该模型在 MMMU 基准上达到 74.4%，在 MathVista 上达到 77.9%，在 MMBench 上达到 87.5%。它支持文本、图像和语音输入，具备强大推理能力。此外还提供语音克隆等特色功能。

AI模型 MiniMax Hailuo 02 多模态推理模型语音克隆

推荐理由：MiniMax 新模型多模态强

00:33

00:33Moonshot AI: Kimi Blog（资讯）

Moonshot AI 在2025年11月发布了Kimi K2 Thinking模型并开源，该模型聚焦于提升智能体和推理能力。同时，公司对Kimi K2 Turbo API进行了价格调整，并为K2官方高速版API提供5折优惠。此外，Kimi K2在2025年9月更新了更强的代码能力和更快的API，8月发布了高速版。这些动作表明Moonshot AI正积极推动其模型的推理与工具调用能力，以降低开发者成本。

AI模型 Kimi K2 开源/仓库推理模型智能体 API/价格

推荐理由：Kimi K2 Thinking开源增强了开源大模型在智能体与推理领域的选择，配合降价策略，开发者可更经济地使用其API进行复杂任务。

00:33

00:33DeepSeek: GitHub 新仓库（资讯）

70°

DeepSeek 的 GitHub 组织页展示了其多个关键开源项目，包括高效FP8内核DeepGEMM、面向AI训练和推理的高性能分布式文件系统3FS、多头部隐式注意力内核FlashMLA、专家并行通信库DeepEP，以及用于V3/R1训练的双向流水线并行算法DualPipe等。这些仓库总计获得数万星标，反映了社区对DeepSeek技术栈的高度关注。此次页面加载存在部分错误，但不影响对核心开源成果的概览。

AI模型开源/仓库推理模型基础设施分布式训练 DeepGEMM

推荐理由：DeepSeek 的开源仓库是其技术实力的集中体现，覆盖了从底层计算内核到分布式训练框架的全链路优化，对追求高效AI基础设施的开发者有重要参考价值。

5月11日

22:18

22:18

NVIDIA AI@NVIDIAAI

70°

NVIDIA AI在X上发布推文，总结了大多数Agent系统面临的核心问题：推理与工具解析在多轮交互中漂移、KV缓存复用失效、工具触发延迟。为此，NVIDIA正通过强化Dynamo框架，使其更好支持Claude Code、OpenClaw、Codex等Agent模式。关键改进包括：稳定提示词以支持KV复用并降低首个Token生成时间（TTFT）、保留多轮推理与工具调用的交错模式、实现流式工具分发而非回合末缓冲、以及对齐真实多轮Agent运行时的行为。这篇博客详细介绍了这些基础设施问题和修复模式，对于正在构建自定义Agent栈或推理端点的开发者有直接参考价值。

AI产品 Agent 推理模型工具调用低延迟 NVIDIA Dynamo

推荐理由：推文直指当前Agent系统在基础设施层面的共性痛点，NVIDIA给出的优化路径对降低延迟、保持上下文一致性及提升工具调用实时性有实际意义。

22:16

22:16

AK@_akhaliq

Apple 推出了新的技术 TIDE，其核心理念是让模型中的每一层都了解 token 的上下文信息。这不同于传统 transformer 仅顶层或特定层感知全局上下文，TIDE 通过在每一层引入上下文信息，可能提升模型对序列的理解和生成能力。相关论文已发布，提供了详细的技术细节。这项研究对改进大型语言模型和多模态模型的上下文利用有潜在意义，值得从业者关注。

论文推理模型多模态 Apple Transformer改进上下文理解

推荐理由：TIDE 是对 transformer 架构的改进，可能提高模型层间的信息流动效率，尤其在长序列或复杂上下文任务中，但尚需更多评估验证其实际收益。