X·KOLX:rohanpaul_ai (@rohanpaul_ai)
杰夫·贝佐斯在CNBC上透露其新公司Prometheus的目标是构建一个“通用工程智能体”,能够设计并制造喷气发动机、芯片、医疗设备等实体产品。该公司宣布完成120亿美元融资,估值达410亿美元,初始资金62亿美元。贝佐斯以喷气发动机为例,说明传统设计周期长达10年,而Prometheus希望将这一周期缩短10倍以上。这笔巨额融资表明,前沿AI竞争已从算法竞赛转向计算资源采购竞赛,投资者实际上是在为未来可能实现模型所需的机器预付款。
X·KOLX:rohanpaul_ai (@rohanpaul_ai)
OpenAI 收购了初创公司 Ona,旨在为 Codex 智能体提供安全的持久云桌面环境。Codex 目前每周用户已达 500 万,增长 400%,但复杂任务需要工具、文件、凭证和日志支持,传统聊天模式已无法满足。Ona 的持久云工作空间让智能体可以独立运行命令、检查系统、保持上下文并跨设备恢复工作。企业用户是此次收购的核心目标,他们希望智能体在企业云边界内运行,并具备权限控制、审计追踪和访问限制。这使得 Codex 更像一个托管执行层,适用于测试、修复、重构、迁移等多步骤知识任务。
X·KOLX:GitHub Blog (@Natalie Guevara)
GitHub 博客介绍了如何通过上下文感知的 LLM 推理来改进秘密扫描的验证步骤,从而大规模减少误报。这一改进使得安全警报更加可信和可操作,降低了开发者的噪音负担。通过利用 LLM 理解代码上下文,GitHub 能够更准确地识别真正的秘密,避免对非敏感信息的误报。这对于依赖 GitHub 进行代码托管和 CI/CD 的团队来说,是一个重要的安全增强。
X·KOLX:Perplexity (@perplexity_ai)
Perplexity AI 宣布其 Deep Research 功能基于全新的 Search as Code 架构构建。该架构让模型能够编写代码来动态组装搜索过程,针对每个问题并行运行数千个检索步骤。在各项基准测试中,该系统的表现均超越了传统的深度研究方法。这一进展意味着 AI 搜索可以更高效、更精准地处理复杂研究任务。
X·KOLX:marktechpost (@Michal Sutter)
xAI 发布了 Grok Build 的插件市场,这是一个终端内的插件商店,集成了技能、智能体、钩子和 MCP 服务器。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers 等知名工具。每个远程插件都经过提交 SHA 验证,确保安全性和可追溯性。此举将 Grok 从单纯的聊天机器人扩展为可扩展的开发平台,开发者可直接在终端中集成第三方服务。
X·KOLX:Claude Code: GitHub Releases (@ashwin-ant)
Anthropic 发布了 Claude Code v2.1.174 版本,主要修复了多个影响用户体验的 Bug。其中包括 /model 选择器不再隐藏 Default 解析的模型家族,Opus、Sonnet 等模型现在会正确显示;修复了背景会话继承错误环境变量导致的问题;修复了 macOS/Linux 上退出时 1-2 秒的卡顿;修复了 git 提交 co-author 显示错误模型名的问题。此外,新增了 wheelScrollAccelerationEnabled 设置以禁用全屏模式下的鼠标滚轮加速,VSCode 版本也增加了使用量归因面板。
官方IT之家
苹果在 iOS 27 系统中为壁纸功能引入 AI 生成能力,用户可通过图乐园(Image Playground)直接创作适配屏幕尺寸的壁纸。操作入口集成在壁纸设置中,无需单独打开应用。系统还会基于相册照片自动生成风格化壁纸建议,所有 AI 壁纸均标注 Image Playground 图标。用户可通过文字描述或选择风格、照片来生成内容,图像自动匹配最佳尺寸,省去手动裁剪。该功能在测试版中已可体验,预计将随 iOS 27 正式版推送。
官方Simon Willison’s Weblog
开发者 Simon Willison 分享了他使用 Claude Fable 5 调试 Datasette Agent 水平滚动条 bug 的经历。Fable 不仅分析了依赖代码,还自主编写 HTML 测试页面、通过 Python 脚本遍历系统窗口并截图、编辑 Datasette 模板注入 JavaScript 触发键盘事件,甚至打开浏览器进行自动化测试。这种「不遗余力」的主动行为展示了 AI 编程助手在复杂调试场景下的强大能力,但也引发了关于安全性和可控性的思考。