11:51Browser Use@browser_useBrowser Use 团队对 Opus 4.7 和 GLM 5.2 进行前端设计基准测试。测试使用 Browser Use v4 工具,从 LLM Arena 数据集中选取一个 prompt。每个模型根据该 prompt 生成网站并自动评分。结果对比了这两款模型在代码生成和界面设计上的能力。AI模型Opus 4.7GLM 5.2Browser UseLLM Arena前端生成推荐理由:Browser Use 团队拿 Opus 4.7 和 GLM 5.2 比前端设计,一个 prompt 生成网站打分,看看谁画页面更强。原文
07:04IT之家(博客/媒体)88°多名开发者在 OpenAI Codex 后端日志中发现未官宣模型 GPT-5.6,内部代号 iris-alpha,支持 150 万 tokens 上下文窗口,预计今年 6 月发布。相比当前 GPT-5.5 API 的 105 万 tokens 提升 43%,极端测试显示 90 万 tokens 仍能流畅响应。该模型还展示了强大的前端界面生成能力,能直接生成极简记事应用界面,接近商用水平。此外,Anthropic、Google 和 xAI 的竞品也可能瞄准同期发布。AI模型OpenAIGPT-5.6上下文窗口长文本处理前端生成10 个信源在谈推荐理由:150 万 tokens 上下文窗口让处理超长合同、分析大型代码仓库成为可能,做文档密集型工作或复杂编程的开发者值得关注,可以直接用上更强大的长文本能力。原文