Anthropic被曝即将发布Claude Sonnet 5,名称已出现
X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置,暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型,上一代为Claude Sonnet 4(2024年发布)。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。
X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置,暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型,上一代为Claude Sonnet 4(2024年发布)。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。
sqlite-utils 4.0rc1 是 v4 的首个候选版本,主要新功能包括数据库迁移和嵌套事务。迁移功能源自独立包 sqlite-migrate,通过 migrations.py 文件定义迁移操作,支持 Python 和命令行两种方式。嵌套事务通过 db.atomic() 上下文管理器实现,基于 SQLite savepoints,简化了嵌套事务管理。该版本包含一些向后不兼容的更改,请用户测试反馈。
Peter Yang 与 HyperFrames 开发者 @liu8in 和 @JakeFromHeyGen 深入拆解了 HyperFrames 的工作机制。该工具提供 5 步法:收集资产并创建 frame.md、编写 storyboard.md、从 HyperFrames 库拉取动画、生成静态帧审查、在 Studio 中合成视频。内置 /website-to-video 技能可将任意 URL 一键转成视频。HyperFrames 完全免费,支持在 Codex 和 Claude Code 中使用。
微软确认自2026年6月起,将自动向符合条件的Windows设备安装Microsoft 365 Copilot客户端。该推送通过Office内置更新程序进行,仅针对预装Microsoft 365桌面客户端的设备。欧洲经济区用户不受影响,企业管理员可选择退出自动部署。用户无需操作即可在Office功能区、侧边栏看到Copilot按钮。
Cloudflare 宣布支持通过 `npx wrangler deploy --temporary` 命令创建临时 Workers 项目,无需注册 Cloudflare 账户即可部署应用。该临时部署将在 60 分钟后自动失效。开发者可用 GPT-5.5 xhigh 等工具构建测试应用,例如用于追踪 HTTP 重定向的工具。部署后可通过提供的 URL 在 60 分钟内认领项目以延长保留时间。
LiteParse v2.1 发布,可将PDF转换为Markdown,速度比Screen Studio放大动作还快。它在olmOCR0-bench、opendataloader-bench、ParseBench三个基准测试上准确率超过pymupdf4llm、opendataloader等工具。完全开源(Apache 2.0),支持CLI、Rust、Node、Python、WASM。可从LlamaIndex官网或GitHub获取。
三星电子在全球范围内为员工部署了ChatGPT Enterprise和Codex,这是OpenAI截至目前最大规模的企业AI部署之一。超过10万名员工将获得访问权限,用于提升编程和日常工作效率。该部署涵盖三星的多个业务部门,包括半导体、消费电子和移动通信。
用户 Tom Osman 利用 Codex 的 "/goal" 循环功能,将提示词设为“遍历应用中每个功能,根据代码创建用户故事和期望行为,维护单一电子表格追踪状态”,随后自动切换到测试每个用户故事并记录所有错误,最终修复逻辑或 UX 错误后再次测试。整个过程无需人工干预,自动处理成百上千的用户故事。该案例展示了 Codex 在自动化测试与修复工作流中的实际应用。
前Meta/Microsoft/Atlassian主任工程师Kun Chen分享了一套完整的Agentic工程工作流,每天可ship 40-50个经测试的生产级PR。核心框架分为四层:造船(终端中心主义,使用WezTerm+tmux+Neovim)、训练船员(Memory+Skills,全局memory仅27行以避免token浪费)、与单个船员协作(语音输入OpenSuperWhisper,自创AXI标准比MCP节省3倍token和2倍延迟)、并行指挥(treehouse管理worktree,First Mate大副编排器)。验证环节采用no-mistakes流水线,在隔离worktree中执行对抗式review和E2E测试,大幅减少人工review耗时。该工作流强调将时间花在任务开头和结尾,中间全交给AI,瓶颈从agent执行力转移到战略思考。
该指南介绍了7种智能体记忆类型:工作记忆、语义记忆、情节记忆、程序记忆、检索记忆、参数记忆和前瞻记忆。每种记忆覆盖存储内容、存储位置和构建时机。包含对比表格和可运行的Python代码示例。
开发者 Omar 分享经验:他几乎不再手动提示或与代理对话,而是通过循环(loops)让代理自主执行。他花更多时间编写验证器(verifiers),提供文本、音频、图片等丰富指令来填补代理的不足。Guinness Chen 建议用户按住听写键随意讲10分钟,将碎片、例外、示例、氛围都喂给模型,利用语言模型擅长从语言中重构潜在意图的能力。这些方法改变了人与代理的交互方式,减少了手工编辑提示的负担。
Tom Osman展示了一个在Codex中运行的自动化循环,用于遍历应用所有功能并生成用户故事与预期行为。该流程维护一个单源电子表格跟踪功能状态,然后切换到测试每个用户故事并记录所有错误。最后修复逻辑或UX错误后,再次测试所有用户行为。这个循环能处理数百个用户故事,展示了Codex的自动化测试能力。