Together AI@togethercompute63Together AI 的语音转文本(STT)模型在 Artificial Analysis 排行榜上包揽了转写速度的前两名。其中 NVIDIA Parakeet TDT 0.6B V3 排名第一,每秒可处理 303 秒音频,速度最快。该模型每 1000 分钟音频仅需 1.50 美元,在三个真实数据集上的平均词错误率为 4.6%。对于构建实时语音助手的 AI 开发者来说,快速 STT 是核心基础设施,Together AI 的云服务能帮助团队降低转录、推理和响应的整体延迟。AI产品语音转文本Together AINVIDIA Parakeet实时语音AI云服务推荐理由:实时语音助手开发者终于有了速度最快的 STT 模型——每秒处理 303 秒音频,成本还低,做语音交互的团队可以直接在 Together AI 上试试。
@OpenAIDevs@OpenAIDevs67OpenAI 在将 Codex 引入 Windows 时面临一个难题:如何让编程代理保持有用,同时避免开发者陷入频繁审批提示或完全机器访问的两难。他们构建了一个 Windows 沙盒环境,允许 Codex 在受限权限下执行代码,既保障系统安全,又减少用户中断。这一设计解决了 AI 编程助手在 Windows 平台上的关键安全与可用性矛盾,使开发者能更流畅地使用 Codex 进行自动化任务。AI产品编程助手CodexWindows沙盒安全推荐理由:Windows 开发者终于有了安全的 AI 编程代理方案——Codex 沙盒解决了权限与效率的平衡难题,做自动化脚本或 CI/CD 的团队可以直接用,建议点开看实现细节。
@OpenAIDevs@OpenAIDevs53OpenAI 为 Codex 推出了 Hooks 和程序化访问令牌两项新功能。Hooks 允许开发者在任务的关键节点运行自定义脚本,例如在任务前后执行验证器、扫描提示中的敏感信息、记录对话到内部系统,或按仓库/目录定制行为。程序化访问令牌则为企业和团队提供了作用域凭证,可在 CI、发布工作流和内部自动化中使用,支持设置过期时间或随时撤销。这些更新使 Codex 能更深度地集成到现有开发流程中,提升安全性和灵活性。AI产品CodexOpenAI编程助手自动化企业级推荐理由:Codex 的 Hooks 和访问令牌让 AI 编程助手真正融入团队工作流,做 CI/CD 或需要安全合规的开发者可以直接用起来。
Claude Code: GitHub Releases@ashwin-ant精选37Anthropic 发布了 Claude Code v2.1.142,主要新增了多个 claude agents 配置标志,包括 --add-dir、--settings、--mcp-config 等,方便自定义后台会话。快速模式默认升级为 Opus 4.7(原 Opus 4.6),可通过环境变量回退。修复了 MCP 工具超时、macOS 休眠后代理消失、Windows 网络驱动器死锁等关键问题,并改进了插件展示和会话标题生成逻辑。AI产品Claude Code代理/AgentMCP/工具修复/优化Anthropic推荐理由:这次更新对使用 Claude Code 做自动化任务的开发者很关键——修复了 macOS 休眠后代理丢失和 MCP 超时硬限制,后台工作流更稳定了。建议升级后重点测试后台代理和 MCP 工具调用。
claudedevs@ClaudeDevs58Claude API 用户可通过预热提示缓存来缩短长提示的首 token 生成时间。具体做法是先发送系统提示(system prompt)而不生成输出,让 Claude 将其写入缓存。当实际用户请求到来时,缓存已预热,从而加速响应。这一技巧对处理长上下文或复杂提示的开发者特别有用,能显著提升 API 调用效率。技巧ClaudeAPI提示缓存性能优化开发者技巧推荐理由:做 Claude API 集成的开发者,这个预热缓存技巧能直接降低长提示的响应延迟,值得在项目中试试。
Matt Wolfe@mreflow58OpenAI 为 Codex 新增了远程操控功能,用户无需守在电脑前即可引导 AI 编程助手完成任务。这一更新解决了 Codex 用户长期以来的痛点,极大提升了工作流的灵活性和效率。用户表示这是他们最期待的功能,尤其适合需要移动办公或远程协作的开发者。AI产品OpenAICodex编程助手远程操控工作流推荐理由:远程操控功能让 Codex 从桌面工具升级为移动助手,经常需要离开电脑的开发者可以随时调整任务,建议试试。
Ethan Mollick@emollick58Ethan Mollick 指出,第二条缩放定律(Second Scaling Law)依然未被打破:只要增加 LLM 的思考 token(thinking tokens),就能在黑客攻击、数学、科学、填字游戏等任务上获得更好表现。目前尚未观察到性能平台期。这一发现对依赖推理能力的 AI 应用开发者有直接指导意义,意味着通过增加计算资源(而非仅扩大模型规模)即可持续提升模型在复杂任务上的表现。论文缩放定律推理模型思考 tokenLLM 性能Ethan Mollick推荐理由:做 LLM 推理优化或复杂任务应用的团队,这条定律意味着你不需要等更大模型——加思考 token 就能直接提升效果,值得在现有模型上试试。
IT之家(博客/媒体)63安全专家利用 Anthropic 最强 AI 模型 Claude Mythos,在苹果 macOS 26.4.1 系统中成功实现提权攻击,从普通本地账户获取 root shell 并绕过 Apple Silicon 的 MIE 保护。攻击结合了 2 个漏洞和多种利用技巧,由人类研究员与 AI 共同完成,耗时约 5 天。这是首个公开的 Apple M5 内核内存破坏利用案例,凸显 AI 在安全研究中的辅助价值。苹果正在审查漏洞,技术细节暂未公开。行业安全漏洞macOSClaude MythosApple Silicon提权攻击推荐理由:安全研究员和 macOS 开发者值得关注——AI 辅助挖洞的效率正在质变,Claude Mythos 帮团队 5 天就打通了 M5 内核提权链,建议点开看看 AI 如何加速漏洞发现。
IT之家(博客/媒体)58开源库 TanStack 遭遇供应链攻击,波及 OpenAI 的两台员工设备,导致部分内部源代码仓库子集被访问。黑客窃取了有限凭证材料,但相关代码具备为 OpenAI 产品签署证书的能力,存在安全风险。OpenAI 已撤销现有证书,并阻止旧证书签名的应用打开。Mac 版 ChatGPT 桌面应用用户需在 6 月 12 日前强制更新,iOS 和 Windows 版不受影响。OpenAI 确认用户数据未被访问,自有系统未被入侵。行业供应链攻击安全更新ChatGPTMacOpenAI推荐理由:Mac 版 ChatGPT 用户需要立即行动,否则应用可能无法使用——这次强制更新源于供应链攻击,涉及代码签名证书安全,直接关系到你的应用能否正常打开。
Simon Willison’s Weblog(博客/媒体)53Mitchell Hashimoto 关于 Bun 从 Zig 迁移到 Rust 的评论引发讨论,指出编程语言正从锁定因素变为可灵活切换。Simon Willison 分享了一个案例:一家中型科技公司用编码代理将 iOS 和 Android 应用重写为 React Native,理由是 React Native 已足够成熟,且未来可轻松移植回原生。这反映了 AI 辅助编程降低了语言和框架的迁移成本,技术决策更灵活。行业React Native编程语言AI辅助编程跨平台开发技术决策推荐理由:编程语言锁定正在瓦解,做跨平台开发的团队值得关注——AI 代理让重写成本骤降,React Native 案例证明技术栈切换已非不可逆。
IT之家(博客/媒体)58据彭博社报道,OpenAI 与苹果的合作关系日趋紧张,OpenAI 正考虑对苹果采取潜在法律行动。OpenAI 原本期望 ChatGPT 能更深入地融入苹果生态,但苹果的保密文化导致 OpenAI 无法了解整合细节,且苹果未充分宣传合作,导致用户不知功能存在。OpenAI 认为合作远未达到预期收入,正评估包括发送正式函件在内的法律选项,但希望庭外解决。行业OpenAI苹果法律行动合作裂痕ChatGPT推荐理由:AI 公司与科技巨头的合作博弈值得关注——做 AI 产品集成的团队可以从中看到合作条款与宣传承诺的重要性,建议点开了解双方分歧细节。
Simon Willison’s Weblog(博客/媒体)58Mitchell Hashimoto 指出,现代编程语言的可替代性日益增强,不再像过去那样成为技术锁定。他以 Bun 从 Zig 重写为 Rust 为例,认为这种迁移可以在大约一两周内完成,表明语言本身变得可替换。这一观点反映了 AI 和工具链进步带来的变化,开发者可以更灵活地选择语言,而不必担心长期绑定。Hashimoto 认为这种趋势对 Rust 等语言既是机遇也是挑战,因为它们的有用性可能随时被取代。行业编程语言BunRustZig技术选型推荐理由:Hashimoto 的观点戳破了编程语言不可替代的迷思,做技术选型的团队和开发者值得思考:你的语言栈真的安全吗?看完可能会重新评估依赖风险。
OpenAI@OpenAI (@OpenAI)58OpenAI 宣布 Codex 在 ChatGPT 移动应用中进入预览阶段。用户现在可以直接在手机上启动新工作、审查输出、引导执行并批准下一步操作。Codex 会在用户的笔记本电脑、Mac mini 或开发机上持续运行。这一更新回应了用户长期以来的需求,将 AI 编程助手从桌面扩展到移动场景,提升了开发工作的灵活性和便捷性。AI产品CodexChatGPT移动端编程助手预览版推荐理由:移动端 Codex 让开发者摆脱桌面束缚,随时随地进行代码审查和任务管理,经常在外办公或需要快速响应代码问题的团队值得一试。
Simon Willison’s Weblog(博客/媒体)41Simon Willison 发布了 datasette-ip-rate-limit 0.1a0,一个用于 Datasette 的 IP 限流插件。该插件由 Codex(GPT-5.5 xhigh)编写,旨在阻止行为不当的爬虫对特定区域进行快速请求。生产配置支持基于请求头的 IP 识别、最大键数、豁免路径以及灵活的限流规则,例如对特定路径在 60 秒窗口内限制 60 次请求,超限后封禁 20 秒。AI产品DatasetteIP限流Codex插件爬虫防护推荐理由:Datasette 用户终于有了一个现成的 IP 限流方案,能有效抵御恶意爬虫,保护站点资源。如果你正在用 Datasette 部署公开数据服务,这个插件可以直接拿来用,配置也很灵活。
IT之家(博客/媒体)58OpenAI 宣布 Codex 现在支持通过手机端 ChatGPT 远程控制 Mac 端任务,用户离开电脑后也能审批任务、查看进展和发起新指令。用户升级手机端 ChatGPT 后,可加载 Codex 在 Mac 上的实时状态,查看对话线程、审批请求和项目上下文。文件、凭据等敏感信息留在原电脑上,仅实时推送截图、终端输出等更新。设置简单,通过扫描 Mac 端二维码即可配对。该功能目前仅支持 Mac,Windows 版本后续推出。AI产品CodexChatGPT远程控制Mac移动办公推荐理由:对于经常需要远程办公或移动中处理 AI 任务的开发者,这个功能解决了必须守在电脑前的痛点,可以直接在手机上管理 Codex 任务,建议试试。
Replit@Replit12单亲妈妈Rebecca Braden因自身经历,在Replit上构建了AI法律助手Case Clarity。该应用帮助用户整理法律文档、沟通记录和时间线,不替代律师但让信息更清晰可用。这个案例展示了普通人如何利用AI工具解决真实生活问题,也体现了Replit降低开发门槛的价值。AI产品AI法律助手Replit低代码开发社会创新个人项目推荐理由:这个真实故事展示了AI如何赋能普通人解决切身痛点——做法律科技或关注AI民主化的开发者,看完会理解“低代码+AI”的落地力量。
berryxia@berryxia58Anthropic 发布新论文《2028:全球AI领导力的两种情景》,分析中美AI竞争格局。论文指出,美国及民主盟友目前在前沿AI上仍领先,主要依赖算力优势和出口管制,但领先窗口正在收窄。中国通过顶尖人才、芯片走私、离岸数据中心和大规模蒸馏攻击快速缩小差距。论文描绘了2028年的两种情景:民主阵营维持12-24个月领先并主导全球AI规则,或中国实现算力接近平价,AI成为威权扩张和军事控制的工具。Anthropic 强调算力是关键,维持领先需控制供应链、堵住漏洞并推动AI出口。行业AI竞争Anthropic算力出口管制全球AI领导力推荐理由:Anthropic 把中美AI竞争的时间线推到了2028年,做AI战略、政策或投资的读者值得一看——它不只是技术分析,更是对全球格局的预判,看完会对出口管制和算力博弈有更深的认知。
berryxia@berryxia76xAI 正式推出 Grok Build 的早期 Beta 版本,这是一个面向开发者的 agentic CLI 工具,专注于代码编写、应用搭建和自动化工作流。它支持并行子代理、计划视图、团队共享市场,并集成 MCP skills、插件、hooks 和 headless 模式。目前仅对 SuperGrok Heavy 订阅者开放,xAI 将根据用户反馈持续迭代。此举表明 xAI 选择优先打磨 CLI 而非聊天界面,旨在将 agent 真正融入日常工作流。AI产品Grok Buildagentic CLIxAI编码工具自动化工作流推荐理由:xAI 把 agent 从 demo 拉进终端工作流,做深度开发的团队可以直接在 CLI 里驱动整个 agent 团队,比聊天界面更贴近实际生产。重度 builder 值得一试。
berryxia@berryxia精选72Prime Intellect 让 Claude Code(Opus 4.5)和 Codex(GPT 5.5)在 nanoGPT speedrun 的 optimizer track 上完全自主运行,使用闲置算力完成约 1 万次实验,消耗 1.4 万 H200 小时。Claude Code 将记录推进到 2930 steps,超越人类基准的 2990 steps,整个过程无人值守。实验在 optimizer 搜索、超参数扫描和方法 stacking 上高效,但在真正创新上遇到瓶颈。Prime Intellect 已开源所有 scratchpad、运行日志、配置和生成的 idea,将 AI 研究自动化从概念变为可复现的现实。AI产品AI研究自动化Claude CodeCodex开源/仓库智能体推荐理由:AI 研究自动化从概念走向可复现现实,做 AI 研究的团队可以直接参考这套开源实验记录,省下大量试错成本。
岚叔@LufzzLiz58Codex 功能已集成到手机版 ChatGPT App 中,用户现在可以直接在移动端使用 Codex 进行代码生成和编辑。这一更新将原本仅限桌面端的强大编程能力带到了移动设备上,极大提升了开发者和编程学习者的便利性。用户无需切换设备即可在手机上完成代码编写、调试和解释任务。此举标志着 OpenAI 进一步扩展了 ChatGPT 的实用场景,让 AI 编程助手真正实现随时随地可用。AI产品CodexChatGPT移动端编程助手AI 产品更新推荐理由:移动端终于有了正经的 AI 编程助手——Codex 集成到 ChatGPT App 后,开发者可以随时在手机上写代码、改 bug,做移动开发或学习编程的人建议立刻更新体验。
NVIDIA AI@NVIDIAAI41OpenShell 发布 v0.0.41 版本,新增智能体驱动的策略管理功能,允许用户通过 shell 直接控制策略和资源。CLI 中增加了沙箱资源标志,支持自定义 CA 用于 OIDC TLS 验证,并改进了沙箱下载的工作区边界检查。该版本还包含多项错误修复和稳定性改进,旨在提升开发者在安全策略和资源管理方面的效率。AI产品智能体策略管理沙箱CLI安全推荐理由:对于需要精细控制沙箱资源和策略的开发者,OpenShell 这次更新直接把管理权交到了 shell 里,省去繁琐配置,值得一试。
Together AI@togethercompute58Together AI 研究团队将有七篇论文在 MLSys 2026 会议上发表,展示从研究到生产的 AI 原生云平台成果。这些论文涵盖 AI 系统优化、模型部署效率等关键领域,体现了 Together AI 在 AI 基础设施方面的技术积累。MLSys 是机器学习系统领域的顶级会议,入选多篇论文说明其技术实力获得学术界认可。行业MLSys 2026AI 基础设施系统优化模型部署Together AI推荐理由:做 AI 基础设施和模型部署的团队值得关注——Together AI 这七篇论文覆盖了从研究到落地的关键环节,能帮你了解当前 AI 系统优化的前沿方向。
Together AI@togethercompute37Together AI 宣布在其平台上推出 Rime Mist v3,这是一系列面向生产环境的文本转语音(TTS)模型。该模型专注于确定性发音和可控语音输出,解决了语音合成中常见的不一致问题。AI 原生开发者现在可以在 Together AI 的专用基础设施上部署 Mist v3,用于需要大规模一致语音输出的企业级语音代理。这为构建可靠、可定制的语音交互系统提供了新的选择。AI产品文本转语音TTS语音代理Together AIRime Mist v3推荐理由:做语音代理和 TTS 应用的团队终于有了一个能保证发音一致性的生产级模型,直接在 Together AI 上就能部署,省去自己调教的麻烦,值得试试。
Anthropic@AnthropicAI37Anthropic 发布了一篇关于中美 AI 竞争的论文,阐述了其对当前局势的看法。论文指出,美国及其民主盟友目前在尖端 AI 领域处于领先地位。文章进一步分析了保持这一领先地位所需的条件和策略。该论文为理解全球 AI 竞争格局提供了重要视角。行业AI竞争中美关系Anthropic地缘政治前沿AI推荐理由:关注 AI 地缘政治的读者必读——Anthropic 从技术前沿视角拆解中美竞争,做政策研究或战略决策的团队值得点开。
François Chollet@fchollet58Keras 包在 PyPI 上的月下载量近日突破 2100 万次,创下历史新高,日下载量峰值约 90 万。五年前首次达到 1000 万月下载时,作者曾认为这已是极限。这一里程碑表明 Keras 在深度学习社区中的持续增长和广泛采用。AI产品Keras深度学习PyPI下载量里程碑推荐理由:Keras 的下载量新高反映了其作为深度学习入门和快速原型工具的持久生命力,做 AI 模型训练的开发者值得关注这一趋势。
Greg Brockman@gdb58OpenAI 宣布,用户现在可以在任何运行 Codex 的地方,通过 ChatGPT 应用直接使用它。这意味着智能体(agent)的调用不再局限于特定平台,而是可以通过 ChatGPT 这一广泛使用的入口进行。这一更新显著降低了智能体的使用门槛,推动了智能体技术的普及和通用化。对于开发者和普通用户来说,这代表了一个更便捷、更统一的智能体交互体验。AI产品智能体CodexChatGPT通用性OpenAI推荐理由:智能体调用终于有了一个统一的入口——ChatGPT 应用,做自动化或智能体开发的团队可以直接在移动端体验,值得立即尝试。
Andrew Ng@AndrewYNg53Andrew Ng 推出新课程《Transformers in Practice》,与 AMD 合作,由 Sharon Zhou 主讲。课程提供基于 Transformer 的 LLM 的实用视角,帮助理解其行为、诊断推理缓慢等问题,并做出更明智的部署决策。课程包含交互式可视化,而非纯视频,让学员动手探索概念。学员将掌握 LLM 幻觉原因、注意力机制、推理瓶颈诊断及 GPU 加速技术。AI模型TransformerLLM课程推理优化AMD推荐理由:想真正理解 LLM 内部机制、诊断推理问题的开发者,这门课能帮你从黑盒用户变成懂原理的实践者,建议直接报名。
TestingCatalog@testingcatalog58OpenAI 宣布 Codex 现已在 ChatGPT 移动应用中可用,支持 iOS 和 Android,覆盖所有计划(包括免费版和 Go 版)及所有支持区域。用户可以通过手机远程控制 Codex 在笔记本电脑、开发环境或远程服务器上执行任务。Windows 版连接支持即将推出。这标志着 AI 编程助手从桌面端扩展到移动端,让开发者能随时随地监控和指挥代码生成。AI产品Codex移动端远程控制编程助手ChatGPT推荐理由:移动端远程控制 Codex 解决了开发者无法时刻守在电脑前的痛点,做编程或自动化任务的团队可以随时随地监控进度,建议试试这个新功能。
The Rundown AI@TheRundownAI58OpenAI 的 Codex 功能正式推出移动端版本,首先通过 iOS 应用向各计划用户推送,Windows 版本即将到来。用户可以在手机上跨线程工作、审查输出、批准命令、切换模型或启动新任务,而不仅仅是远程控制单个任务。这标志着 AI 编程助手从桌面端向移动端的重要扩展,让开发者能随时随地管理代码工作流。AI产品Codex移动端iOS编程助手远程工作推荐理由:Codex 移动端解决了开发者离开电脑后无法管理 AI 编程任务的痛点,经常远程办公或需要随时跟进代码的团队可以直接在手机上操作,建议 iOS 用户立即更新体验。
Ethan Mollick@emollick37Ethan Mollick 在推文中提出,在学术研究中让人类对AI使用负责是短期内合理的问题解决方式。他认为,当前阶段通过明确责任归属可以应对AI带来的挑战与机遇,但长期来看,自主科学工作将需要不同的解决方案。这一观点强调了人类监督在AI应用中的重要性,尤其是在学术领域。行业AI责任学术研究人类监督Ethan Mollick短期解决方案推荐理由:学术研究者和管理者需要明确AI使用中的责任边界,Mollick的观点提供了短期可行的思路,值得关注并思考如何在自己的工作中实施。
OpenAI: 官网动态(博客/媒体)37OpenAI 宣布 Codex 现在可以通过 ChatGPT 移动应用在任何地方使用。用户可以在移动设备上实时监控、引导和批准编码任务,支持跨设备和远程环境。这一更新使得开发者能够更灵活地管理 AI 辅助编程工作流,无需始终待在电脑前。Codex 的移动端集成提升了开发效率,尤其适合需要频繁切换场景或远程协作的团队。AI产品CodexChatGPT移动应用编程助手远程协作推荐理由:远程管理 Codex 编码任务解决了移动办公场景下的编程协作痛点,做 AI 辅助开发的团队可以直接在手机上审批代码,建议试试。
OpenAI Blog(博客/媒体)37OpenAI 发布了 ChatGPT 的安全更新,旨在改善模型在敏感对话中的上下文感知能力。新机制能够随时间检测风险,并更安全地回应。这解决了模型在长期或复杂敏感对话中可能忽略关键上下文的问题。更新通过增强对对话历史的分析,帮助 ChatGPT 更准确地识别潜在风险场景。用户将受益于更可靠、更安全的交互体验。AI产品ChatGPT安全更新上下文感知敏感对话风险检测推荐理由:对于经常与 ChatGPT 讨论敏感话题的用户,这次更新能显著降低误判风险,建议关注具体改进细节。
TestingCatalog@testingcatalog58Kimi 推出了名为 Kimi Web Bridge 的浏览器扩展,旨在为多种 AI 智能体(如 Claude Code、Hermes、Codex、Kimi Code CLI 等)提供统一的浏览器操作接口。该扩展解决了不同智能体各自需要独立浏览器集成的问题,让开发者只需安装一个扩展即可让多个智能体共享浏览器控制能力。这降低了智能体工具链的碎片化,提升了开发效率。目前该扩展已可用,适合需要同时使用多个 AI 编程助手的团队。AI产品Kimi浏览器扩展智能体MCP/工具编程助手推荐理由:Kimi 用一个扩展解决了多智能体各自为战的浏览器控制问题,做 AI 编程或自动化测试的开发者不用再为每个工具装不同插件,值得直接上手试试。
berryxia@berryxia58Tom 兄弟开源了 html-anything,一个用 1.5 万行代码构建的工具,旨在让 AI Agent 将 Markdown、CSV、JSON、图片等 11 种格式直接转换为高质量、专业设计的 HTML。它内置 75 套模板,支持杂志风格、海报、小红书笔记、推文卡片等多种输出形态,并兼容 Claude Code、Cursor 等十几个本地 code agent。工具完全本地运行,无需 API key,边际成本几乎为零,解决了 Agent 输出干巴巴文本的问题。对每天用 Agent 做内容、报告、产品演示的用户来说,这是一个实用的提升。AI产品开源/仓库AI AgentHTML生成模板本地运行推荐理由:html-anything 补上了 AI Agent 的呈现短板,做内容、报告、产品演示的团队可以直接用它把数据变成专业 HTML,省去手动排版的时间。
berryxia@berryxia58Meta 推出 Incognito Chat with Meta AI,宣称这是全球第一个真正私密的 AI 聊天方式。该功能不记录聊天记录、不用于训练模型、不推送广告,且内容不会被任何人看到。Meta 高管在采访中回应了隐私疑虑,强调这是对用户数据的绝对保护。此举与 Meta 依赖数据的商业模式形成鲜明对比,可能标志着 AI 隐私领域的重大转折。AI产品MetaAI 聊天隐私Incognito Chat数据安全推荐理由:Meta 主动打破数据依赖模式,推出真正私密的 AI 聊天,对隐私敏感的用户和 AI 行业观察者来说,这是值得关注的信号——建议点开看看他们如何平衡隐私与商业模式。
Ethan Mollick@emollick41近期各大AI实验室在消息发布上变得更加谨慎和自律,这是面对外界日益严格审视的必然结果。与过去两年那种神秘预言或混乱格言式的沟通风格相比,现在的信息输出显得更加平淡。这种变化可能掩盖了实验室的真实想法和进展,但也反映了行业成熟和监管加强的趋势。行业AI实验室行业动态信息透明度监管压力沟通策略推荐理由:关注AI行业动态的人会发现,实验室沟通风格的转变背后是监管压力与商业策略的博弈,值得思考这对未来技术透明度和公众认知的影响。
shao__meng@shao__meng精选73Cline 团队发布了 Cline SDK,同时推出基于 SDK 的 Cline CLI 和 Skills。Cline 是最早的 Agentic Coding 工具之一,此前以 IDE 插件形式存在,技术实力强,工程团队多人曾加入 Codex。最新 Cline CLI 在 Terminal-Bench 2.0 上多项第一,超越 Claude Code、Codex 和 Droid 等 Agent。Cline 2.0 重写了 prompts、简化 loop、收紧上下文管理、改进反馈与错误处理,并重新设计工具暴露方式。在开源权重模型上领先更明显,如 kimi-k2.6 达 55.1% vs OpenCode 37.1%。新能力包括 Plugin 层、Provider 开放性、原生 Agent Teams、开箱即用的 CRON/checkpointing/Web search/MCP connector,以及实验性的 CLI Connectors 可接入 Telegram/WhatsApp/Slack。AI产品Agentic CodingClineCLISDKTerminal-Bench推荐理由:Cline SDK 和 CLI 的发布让 Agentic Coding 工具链更开放灵活,做 AI 编程工具或 Agent 开发的团队可以直接用 Plugin 层和 Provider 扩展,值得关注其 Terminal-Bench 成绩和 Harness 实践。
shao__meng@shao__meng63Kimi 发布了名为 Kimi Web Bridge 的浏览器扩展,能将编码型或通用型 AI Agent 接入用户本地的 Chrome/Edge 浏览器,使其具备点击、滚动、输入、抓取、截图等真实网页操作能力。该扩展复用用户真实浏览器而非新建沙箱,完全本地化执行,且开放接入而非闭环产品。官方展示了四个案例:跨平台批量搜索并写表格、看网站后复刻、从日常操作学习技能、自动填写 Google Form。这一工具让 Agent 从“看”网页升级为“操作”网页,显著扩展了自动化场景。AI产品Kimi浏览器扩展Agent自动化网页操作推荐理由:做自动化流程或 Agent 开发的团队终于有了一个直接操作真实浏览器的工具——Kimi Web Bridge 让 Agent 能像人一样点击、填表、抓取,建议搞 RPA 或浏览器自动化的开发者立刻试试。
berryxia@berryxia58Kimi 发布了 Web Bridge 浏览器扩展,使 AI Agent 能像人类一样在浏览器中搜索、滚动、点击和输入,完成整套任务。演示视频显示,Agent 可同时在多个平台搜索并自动整理到 Excel,也能分析网页结构并复制内容,甚至根据对话自动创建调研问卷。该扩展原生支持 Kimi Code CLI、Claude Code、Cursor 等工具,解决了 AI Agent 只能看不能动的痛点。Web Bridge 已在 Chrome 应用商店上线,用户可免费试用。AI产品KimiWeb BridgeAI Agent浏览器扩展自动化推荐理由:Kimi 把 AI Agent 从“只会聊天”拉到“能操作浏览器”的维度,做自动化、信息收集或开发测试的团队可以直接安装试试,效率提升肉眼可见。
berryxia@berryxia63腾讯AI团队经过6个月研发,开源了一套Agent记忆系统,针对长会话中上下文丢失问题提出三招解决方案:实时压缩过期上下文(token消耗降低61%)、用Mermaid语法生成结构化任务地图(减少30多步复杂流程中的丢轨概率)、建立Persona记忆(人格一致性从48%提升至76%)。这套系统已在GitHub开源,旨在解决Agent记忆的核心难题——让模型在正确时间用正确方式想起正确信息。AI产品智能体记忆系统开源/仓库腾讯AI上下文管理推荐理由:做Agent开发的团队终于有了开箱即用的记忆方案,不用再靠堆token硬扛长上下文——腾讯这套系统直接开源,建议立刻去试。