全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

18:45

18:45IT之家（博客/媒体）

月之暗面今日发布并开源 Kimi K2.7 Code 编程模型，相比 K2.6 在长上下文编程、指令遵循和长程任务性能上显著提升，平均 token 消耗减少 30%。内外部基准测试显示，代码能力提升 11%-31.5%，Agent 自主化执行能力提升约 10%。模型已通过 Kimi API 开放平台提供，价格与 K2.6 一致，并预告 6 月 15 日推出 5-6 倍输出速度的高速版，仅需 2 倍价格。非编程任务仍推荐使用 K2.6 模型。

AI模型月之暗面 Kimi K2.7 Code 编程模型开源/仓库 API

推荐理由：Kimi K2.7 Code 在编程场景下 token 消耗降低 30%，做 AI 编程的开发者可以立刻通过 API 体验，高速版下周上线值得关注。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

23:53

Decoder@Maximilian Schreiner

据《华尔街日报》报道，OpenAI 正在考虑降低 API Token 价格，以从 Anthropic 手中争夺客户。此举表明两大 AI 巨头在 API 服务领域的竞争正从模型能力扩展到定价策略。价格战可能使开发者获得更低的调用成本，但也可能压缩中小型 AI 公司的利润空间。目前双方尚未公布具体降价方案，但市场已开始关注这一动向。

行业 OpenAI Anthropic API 价格战开发者

推荐理由：API Token 降价直接影响调用成本，做 AI 应用开发的团队可以关注后续定价调整，提前规划预算。

原文

21:23

21:23IT之家（博客/媒体）

DeepSeek 开放平台因缓存计费系统在 2026 年 5 月 13 日至 6 月 9 日期间出现数据错误，导致部分 API 用户计费受影响。DeepSeek 团队已自动将相应金额以赠金形式返还至用户账户，并优先从赠金账户扣款。用户可登录平台查看到账情况，DeepSeek 已就此事致歉。此前 DeepSeek 发布 V4 系列大模型并大幅降价，此次故障处理体现了其对用户权益的重视。

AI产品 DeepSeek API 计费系统退款赠金

推荐理由：API 用户最怕计费出问题，DeepSeek 主动退款并优先扣赠金，做 AI 应用开发或调用 API 的团队可以放心继续使用，这种处理方式值得点赞。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

15:00

15:00IT之家（博客/媒体）

88°

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式，首次在 1 万亿参数模型上实现超过 1000 tokens/s 的输出速度。该模式 API 已上线，定价为原版的 3 倍，但输出速度提升约 10 倍。由于高速推理资源有限，该模式采取申请制限时开放，申请通过的用户可在 2026 年 6 月 9 日至 6 月 23 日期间免费体验 Chat 功能，每日最多 10 次会话，每次最长 30 分钟。这一突破标志着万亿参数模型在实时推理场景中的实用化迈出关键一步。

AI模型万亿参数模型推理速度 MiMo TileRT API

推荐理由：万亿参数模型首次达到千 tokens/s 输出，做大规模推理或实时 AI 应用的团队可以直接申请体验，看看能否真正落地到生产环境。

原文

6月4日

15:24

15:24IT之家（博客/媒体）

Meta 公司原计划于 4 月发布其闭源 AI 模型 Muse Spark 并同步推出 API，但至今仍未兑现。该模型由 Meta 超级智能实验室开发，内部评测称其可与 OpenAI、Anthropi 竞争，并领先 xAI 的 Grok。然而，由于测试中暴露的漏洞和基础设施扩建需求，发布时间从 4 月推迟至 5 月，再至 6 月。这标志着 Meta 从开源转向闭源路线的关键产品遭遇“难产”，开发者仍无法验证其能力。

AI模型 Meta Muse Spark 闭源模型 API AI 模型延迟

推荐理由：Meta 闭源转型的关键模型一再跳票，关注 AI 模型竞争格局的开发者值得了解背后的技术挑战和延期原因。

原文

6月3日

00:15

00:15IT之家（博客/媒体）

腾讯云智能体开发平台宣布自2026年6月3日起，对DeepSeek-V4系列模型进行价格下调。其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%，缓存命中价格降幅高达97.5%；DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。该系列模型总参数达1.6万亿，采用混合专家架构，原生支持100万Token上下文长度。此次降价是腾讯云在平台接入层面的进一步调整，此前DeepSeek官方已于5月23日宣布V4-Pro API永久降价。

AI产品腾讯云 DeepSeek-V4 模型降价智能体 API

推荐理由：腾讯云大幅降低DeepSeek-V4系列模型调用成本，做AI应用开发或智能体集成的团队可以直接降低推理成本，缓存命中价格降幅高达97.5%，高频调用场景尤其划算，建议开发者抓紧调整预算。

原文

5月28日

17:55

17:55IT之家（博客/媒体）

5月28日上午，DeepSeek 出现服务故障，网页对话和API均受影响，官方状态页面显示为“部分中断”。故障于10:21被定位，10:50修复，持续约半小时。这是DeepSeek本月第五次服务问题，其中两次为完全中断。频繁故障可能影响用户信任和日常使用体验。

行业 DeepSeek 服务故障 API 稳定性行业动态

推荐理由：DeepSeek 本月已崩五次，做AI应用开发的团队需要评估其稳定性，建议关注官方后续的改进措施。

原文

10:29

10:29IT之家（博客/媒体）

OpenAI 于 5 月 27 日确认 ChatGPT 及其 API 服务出现高延迟问题，用户在北京时间凌晨遇到响应变慢。OpenAI 在状态页面于 22:47 确认问题，并于次日凌晨 4:06 修复。目前仍有 Codex 上下文压缩慢和安卓企业版切换工作区问题未完全解决。

行业 OpenAI ChatGPT API 高延迟服务故障

推荐理由：API 延迟直接影响开发者和企业用户的业务效率，使用 OpenAI 服务的团队建议关注状态页面，避免在高峰期调用。

原文

5月23日

21:18

21:18IT之家（博客/媒体）

DeepSeek 宣布其 API 已完成输出速度提升和服务扩容，默认支持 500 并发同时在线，企业用户可申请更大并发。此前，DeepSeek-V4-Pro 模型 API 价格将于 2026 年 5 月 31 日结束 2.5 折优惠，正式调整为原价的 1/4，大幅降低使用成本。此次升级旨在提升开发者体验，满足高并发场景需求。

AI产品 DeepSeek API 服务扩容并发降价

推荐理由：DeepSeek API 提速扩容后，默认 500 并发对高流量应用开发者是直接利好，配合即将到来的降价，做 AI 应用或服务的团队值得关注。

原文

5月22日

22:50

22:50IT之家（博客/媒体）

DeepSeek 官方宣布，DeepSeek-V4-Pro 模型 API 将于 2026 年 5 月 31 日结束 2.5 折优惠活动后，正式调整为原定价的 1/4，即永久保持当前折扣水平。原价输入（缓存命中）0.1 元/百万 Tokens、输入（缓存未命中）12 元/百万 Tokens、输出 24 元/百万 Tokens，降价后相当于缓存未命中输入降至 3 元/百万 Tokens，输出降至 6 元/百万 Tokens。这一调整意味着开发者可以长期享受低成本调用高性能模型的便利，无需担心优惠到期后价格反弹。

AI产品 DeepSeek API 降价大模型开发者

推荐理由：DeepSeek 把 API 价格直接砍到 1/4 并永久生效，做 AI 应用开发或高频调用大模型的团队可以放心接入，不用再盯着优惠截止日期了。

原文

10:08

10:08IT之家（博客/媒体）

83°

智谱今日面向部分企业客户推出 GLM-5.1 高速版 API，输出速度达到 400 tokens/s，刷新全球大模型 API 速度上限。该模型首次在国产大模型中实现旗舰级能力与低延迟的结合，打破了高速模型通常为轻量级模型的行业惯例。GLM-5.1 高速版由智谱 GLM 团队与 TileRT 团队联合打造，在推理引擎、调度系统和基础设施三个层面进行系统级优化，确保 400 TPS 是稳定可用的生产级能力。该模型适用于 AI 编程、实时交互、商业决策、实时语音等对响应延迟要求高的场景，现已面向部分企业客户开放服务。

AI模型智谱 GLM-5.1 高速推理 API 国产大模型

推荐理由：智谱把旗舰模型的推理速度拉到 400 tokens/s，做实时交互、AI 编程的团队可以直接用，延迟敏感场景终于有了国产高性能选项，建议点开看技术细节。

原文

5月21日

08:00

OpenAI@OpenAI (@OpenAI)

OpenAI 宣布推出 Guaranteed Capacity 服务，允许客户长期预留 OpenAI 计算资源。该服务基于 OpenAI 在基础设施、合作伙伴关系和容量规划方面的长期投资，旨在帮助客户在计算资源受限的环境中为关键工作负载提前规划。这对于依赖 OpenAI API 进行大规模推理或训练的企业用户尤为重要，可避免资源争抢和不可预测的访问限制。

AI产品 OpenAI 计算资源企业服务容量保障 API

推荐理由：依赖 OpenAI API 做关键业务的企业团队终于可以提前锁定计算资源，避免高峰期排队或限流，建议有稳定推理需求的团队直接了解。

原文

5月20日

07:02

07:02Simon Willison’s Weblog（博客/媒体）

83°

谷歌在 I/O 大会上正式发布 Gemini 3.5 Flash，跳过预览版直接进入通用可用阶段。该模型支持 104 万输入 token 和 6.5 万输出 token，知识截止于 2025 年 1 月。价格显著上涨：输入每百万 token 1.5 美元，输出 9 美元，是前代 3 Flash Preview 的 3 倍、3.1 Flash-Lite 的 6 倍，接近 3.1 Pro 水平。尽管如此，谷歌仍将其部署到 Gemini 应用、AI 搜索模式、Antigravity 平台、AI Studio 等全线产品。同时推出新的 Interactions API（测试版），类似 OpenAI 的服务器端历史管理。这反映出三大 AI 实验室都在试探 API 客户的价格承受力。

AI模型 Gemini 3.5 Flash 谷歌 I/O 模型定价 API Interactions API

推荐理由：Gemini 3.5 Flash 价格翻倍但谷歌全线铺开，做 AI 应用开发的团队需要评估成本变化，建议点开看看定价对比和 API 新特性。

原文

03:38

03:38Google Blog: AI（博客/媒体）

72°

Google I/O 2026 大会上，Google 发布了一系列 AI 和开发者工具更新，旨在让 AI 更贴近实际应用。重点包括 Gemini 模型的进一步整合、新的开发工具链，以及面向企业和个人的 AI 功能。这些更新降低了 AI 开发门槛，同时提升了用户体验。对于开发者而言，新的 API 和平台支持将加速 AI 应用的构建和部署。

AI产品 Google I/O Gemini 开发者工具 AI 应用 API

推荐理由：Google I/O 2026 的 AI 更新直接影响了开发者和企业用户，做 AI 应用或依赖 Google 生态的团队可以快速了解新工具和 API，建议点开看看哪些能直接用到你的项目中。

原文

5月19日

08:25

08:25IT之家（博客/媒体）

72°

Anthropic 宣布收购软件基础设施初创公司 Stainless，成交额超 2.8 亿欧元（约 22.18 亿元人民币）。Stainless 专注于自动化创建和维护 SDK，能将 API 规格说明直接转换成可部署工具，并支持多种编程语言，在 API 变化时自动更新代码。收购后，Stainless 关闭所有外部托管服务，现有客户无法再获得官方更新。此举使 OpenAI、谷歌等此前依赖 Stainless 的 AI 实验室失去关键工具，Anthropic 则强化了对 AI 智能体开发连接层的控制。

行业 Anthropic Stainless SDK/工具 API 收购

推荐理由：Stainless 的 SDK 自动化工具曾是 OpenAI、谷歌等团队的共用基础设施，Anthropic 的收购直接切断了竞争对手的依赖，做 AI 智能体或 API 集成的开发者值得关注这一战略变化。

原文