精选 AI 资讯 · AI 热点

6月24日

05:58

05:58

@OpenAIDevs@OpenAIDevs

精选76°

OpenAI 在 X 上总结了过去6个月为API推出的30多项更新。新模型包括 GPT-5.5、GPT-5.4 mini、GPT-5.4 nano、GPT-Realtime-2、GPT-Realtime-Whisper、GPT-Realtime-Translate 和 GPT-Image-2。Agent 构建模块新增 Agents SDK harness & sandbox、Skills in the Responses API、Server-side compaction、WebSocket mode 和 Hosted shell。此外还推出了 Admin API 增强、OpenAI CLI 以及 Models on Amazon Bedrock 等新功能。

AI产品 OpenAI GPT-5.5 GPT-5.4 mini API 智能体

推荐理由：搞API开发的朋友，OpenAI 这半年偷偷发了这么多新模型和Agent工具，GPT-5.5和实时翻译很实用，赶紧看看你漏了哪个。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

10:49

10:49

GitHub@github

精选76°

GitHub 宣布 Copilot SDK 现已正式可用，提供稳定 API 和生产级支持。开发者可将 Copilot 的智能引擎嵌入自己的应用、服务和开发工具中。这意味着第三方工具和平台可以原生集成 Copilot 的代码补全和对话能力，无需用户切换上下文。该 SDK 面向企业级场景，支持自定义工作流和扩展。

AI产品 GitHub Copilot SDK 编程助手 API 开发工具

推荐理由：做开发工具或平台集成的团队可以直接用 Copilot SDK 把 AI 编程能力嵌入自家产品，省去自研成本，值得关注。

6月2日

10:50

10:50

宝玉@dotey

精选

开发者建议AI编程助手如Codex和Cursor向右侧Web视图开放API，使网页能直接向左侧聊天界面发送提示（含文本和图片）。例如，类似Claude Design的网页可添加输入框，用户输入后调用类似window.codex.sendPrompt的API将内容推送到聊天界面。这能实现代理与网页更深层次的交互，解锁更多可能性。

AI产品 Codex Cursor API AI编程助手 Web交互

推荐理由：这个想法解决了AI编程助手与网页交互的割裂问题，做AI工具或Web应用的开发者值得关注，可以尝试在项目中实现类似机制。

6月1日

23:20

23:20

Philipp Schmid@_philschmid

精选

Google 在 Gemini API 中推出了 Managed Agents 功能，旨在简化 AI 智能体的构建。开发者只需一次 API 调用，即可创建一个能在托管 Linux 沙箱中推理、编写和运行代码、管理文件的智能体。该服务将循环和环境管理移至平台端，让开发者专注于产品构建而非基础设施。团队表示将快速迭代并欢迎反馈。

AI产品智能体 Gemini API 托管服务沙箱 API

推荐理由：做 AI 智能体开发的团队终于可以省去环境搭建的麻烦——单次 API 调用就能跑起一个完整智能体，建议直接试试。

14:50

14:50

歸藏(guizang.ai)@op7418

精选76°

MiniMax 正式发布大版本模型升级 MiniMax M3，核心亮点包括标配 1M 超长上下文、采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20，大幅提升可落地性。API 价格同步更新，小于 512k 的 API 限时五折（7 天）。模型权重和技术报告将在约 10 天后开源。

AI模型 MiniMax M3 长上下文稀疏注意力多模态 API

推荐理由：MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里，而且计算效率大幅提升，做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试，价格也很友好。

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

12:40

12:40

LlamaIndex@llama_index

精选

LlamaIndex 今日发布了 LlamaParse Opus 4.8 版本，并公布了 ParseBench 评测结果。新版本在表格解析、语义格式和布局方面有轻微提升，但在图表解析和内容忠实度上出现小幅退步。同时，每页价格略有上涨。团队表示，在教 LLM 像人类一样阅读文档方面仍有大量优化空间。LlamaParse 依然是 AI 智能体最佳的文档摄取 API。

AI产品 LlamaParse 文档解析 ParseBench AI智能体 API

推荐理由：做文档解析或构建 AI 智能体的开发者，可以看看 ParseBench 的详细数据，评估是否值得升级。

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月28日

09:48

09:48

Greg Brockman@gdb

精选76°

OpenAI 宣布支持企业将 MCP 服务器部署在私有网络内，ChatGPT、Codex 和 Responses API 可通过出站 HTTPS 安全连接。这解决了企业数据隐私与 AI 工具集成之间的核心矛盾，让团队在不暴露内部服务的前提下使用 OpenAI 产品。开发者可以保持 MCP 服务器在内部网络，同时享受 OpenAI 的 AI 能力，无需担心数据外泄。该功能现已开放，适合需要安全 AI 集成的企业团队。

AI产品 MCP/工具 OpenAI 企业安全私有部署 API

推荐理由：企业终于能安全地让 ChatGPT 和 Codex 连接内部数据了——做 AI 集成或数据安全的团队可以直接用，无需担心隐私泄露。

5月22日

23:05

23:05

Philipp Schmid@_philschmid

精选83°

Google I/O 上，Phil Schmid 展示了 Gemini Managed Agents 的新 Interactions API，允许开发者通过一次 API 调用为 AI 提供一个安全托管的 Linux 沙箱环境。这个沙箱让 AI 可以执行代码、管理自己的内存，相当于拥有了一个独立的“电脑”。这大大简化了构建复杂智能体的流程，降低了开发门槛。对于需要让 AI 自主操作环境的场景，这是一个重要的基础设施更新。

AI产品智能体 Gemini API 沙箱 Google I/O

推荐理由：做智能体开发的团队终于可以省去自己搭建沙箱的麻烦——一次 API 调用就能给 AI 一个安全 Linux 环境，建议直接看演示。

5月14日

13:27

13:27

shao__meng@shao__meng

精选

LandingAI 发布了一个名为“解析前”的页面级分类 API，能在昂贵的文档解析之前对 PDF 逐页打标签。它解决企业文档混杂的问题：如 50 页房贷 PDF 中混有工资单、银行流水等，直接解析会浪费算力并导致抽取幻觉。API 支持自定义类别列表、并发逐页评估、返回标签及推理说明，还能处理未知页面并建议类别。企业可根据标签丢弃无关页或分流到不同流水线，调用方式为简单的 curl POST 请求。

AI产品文档解析页面分类 API LandingAI 企业AI

推荐理由：做文档处理或企业 RAG 的团队，终于有个低成本方案在解析前先做“分诊”，避免为噪音付 OCR 和 LLM 的冤枉钱，值得直接试。