05:58@OpenAIDevs@OpenAIDevs精选76°OpenAI 在 X 上总结了过去6个月为API推出的30多项更新。新模型包括 GPT-5.5、GPT-5.4 mini、GPT-5.4 nano、GPT-Realtime-2、GPT-Realtime-Whisper、GPT-Realtime-Translate 和 GPT-Image-2。Agent 构建模块新增 Agents SDK harness & sandbox、Skills in the Responses API、Server-side compaction、WebSocket mode 和 Hosted shell。此外还推出了 Admin API 增强、OpenAI CLI 以及 Models on Amazon Bedrock 等新功能。AI产品OpenAIGPT-5.5GPT-5.4 miniAPI智能体10 个信源在谈推荐理由:搞API开发的朋友,OpenAI 这半年偷偷发了这么多新模型和Agent工具,GPT-5.5和实时翻译很实用,赶紧看看你漏了哪个。原文
10:49GitHub@github精选76°GitHub 宣布 Copilot SDK 现已正式可用,提供稳定 API 和生产级支持。开发者可将 Copilot 的智能引擎嵌入自己的应用、服务和开发工具中。这意味着第三方工具和平台可以原生集成 Copilot 的代码补全和对话能力,无需用户切换上下文。该 SDK 面向企业级场景,支持自定义工作流和扩展。AI产品GitHub CopilotSDK编程助手API开发工具推荐理由:做开发工具或平台集成的团队可以直接用 Copilot SDK 把 AI 编程能力嵌入自家产品,省去自研成本,值得关注。原文
10:50宝玉@dotey精选开发者建议AI编程助手如Codex和Cursor向右侧Web视图开放API,使网页能直接向左侧聊天界面发送提示(含文本和图片)。例如,类似Claude Design的网页可添加输入框,用户输入后调用类似window.codex.sendPrompt的API将内容推送到聊天界面。这能实现代理与网页更深层次的交互,解锁更多可能性。AI产品CodexCursorAPIAI编程助手Web交互3 个信源在谈推荐理由:这个想法解决了AI编程助手与网页交互的割裂问题,做AI工具或Web应用的开发者值得关注,可以尝试在项目中实现类似机制。原文
23:20Philipp Schmid@_philschmid精选Google 在 Gemini API 中推出了 Managed Agents 功能,旨在简化 AI 智能体的构建。开发者只需一次 API 调用,即可创建一个能在托管 Linux 沙箱中推理、编写和运行代码、管理文件的智能体。该服务将循环和环境管理移至平台端,让开发者专注于产品构建而非基础设施。团队表示将快速迭代并欢迎反馈。AI产品智能体Gemini API托管服务沙箱API推荐理由:做 AI 智能体开发的团队终于可以省去环境搭建的麻烦——单次 API 调用就能跑起一个完整智能体,建议直接试试。原文
14:50歸藏(guizang.ai)@op7418精选76°MiniMax 正式发布大版本模型升级 MiniMax M3,核心亮点包括标配 1M 超长上下文、采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20,大幅提升可落地性。API 价格同步更新,小于 512k 的 API 限时五折(7 天)。模型权重和技术报告将在约 10 天后开源。AI模型MiniMax M3长上下文稀疏注意力多模态API6 个信源在谈推荐理由:MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里,而且计算效率大幅提升,做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试,价格也很友好。原文
12:40LlamaIndex@llama_index精选LlamaIndex 今日发布了 LlamaParse Opus 4.8 版本,并公布了 ParseBench 评测结果。新版本在表格解析、语义格式和布局方面有轻微提升,但在图表解析和内容忠实度上出现小幅退步。同时,每页价格略有上涨。团队表示,在教 LLM 像人类一样阅读文档方面仍有大量优化空间。LlamaParse 依然是 AI 智能体最佳的文档摄取 API。AI产品LlamaParse文档解析ParseBenchAI智能体API推荐理由:做文档解析或构建 AI 智能体的开发者,可以看看 ParseBench 的详细数据,评估是否值得升级。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
09:48Greg Brockman@gdb精选76°OpenAI 宣布支持企业将 MCP 服务器部署在私有网络内,ChatGPT、Codex 和 Responses API 可通过出站 HTTPS 安全连接。这解决了企业数据隐私与 AI 工具集成之间的核心矛盾,让团队在不暴露内部服务的前提下使用 OpenAI 产品。开发者可以保持 MCP 服务器在内部网络,同时享受 OpenAI 的 AI 能力,无需担心数据外泄。该功能现已开放,适合需要安全 AI 集成的企业团队。AI产品MCP/工具OpenAI企业安全私有部署API10 个信源在谈推荐理由:企业终于能安全地让 ChatGPT 和 Codex 连接内部数据了——做 AI 集成或数据安全的团队可以直接用,无需担心隐私泄露。原文
23:05Philipp Schmid@_philschmid精选83°Google I/O 上,Phil Schmid 展示了 Gemini Managed Agents 的新 Interactions API,允许开发者通过一次 API 调用为 AI 提供一个安全托管的 Linux 沙箱环境。这个沙箱让 AI 可以执行代码、管理自己的内存,相当于拥有了一个独立的“电脑”。这大大简化了构建复杂智能体的流程,降低了开发门槛。对于需要让 AI 自主操作环境的场景,这是一个重要的基础设施更新。AI产品智能体GeminiAPI沙箱Google I/O推荐理由:做智能体开发的团队终于可以省去自己搭建沙箱的麻烦——一次 API 调用就能给 AI 一个安全 Linux 环境,建议直接看演示。原文
13:27shao__meng@shao__meng精选LandingAI 发布了一个名为“解析前”的页面级分类 API,能在昂贵的文档解析之前对 PDF 逐页打标签。它解决企业文档混杂的问题:如 50 页房贷 PDF 中混有工资单、银行流水等,直接解析会浪费算力并导致抽取幻觉。API 支持自定义类别列表、并发逐页评估、返回标签及推理说明,还能处理未知页面并建议类别。企业可根据标签丢弃无关页或分流到不同流水线,调用方式为简单的 curl POST 请求。AI产品文档解析页面分类APILandingAI企业AI推荐理由:做文档处理或企业 RAG 的团队,终于有个低成本方案在解析前先做“分诊”,避免为噪音付 OCR 和 LLM 的冤枉钱,值得直接试。原文