全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

14:15

14:15

AI产品黄叔@PMbackttfuture

针对Codex写作内容AI味重的问题，作者提出使用Skill功能在不同阶段指定不同模型（如GPT5.5与DeepSeek交互配合）来优化输出。通过将内容整理后交付给DeepSeek写作，再由Codex审查，显著改善了逐字稿质量。该方法在保持Codex性价比、推理和Agentic能力的同时，解决了其理工直男式的写作风格问题。

AI产品 Codex GPT5.5 DeepSeek 写作优化 Skill

推荐理由：做内容创作的开发者终于不用在AI味和性价比之间二选一了——用Skill混合模型就能让Codex写出更自然的文本，建议试试这个组合策略。

6月8日

00:44

00:44

宝玉@dotey

用户 @ysober 在 X 上分享实测结果：使用 Claude 配合 Qwen3.7-Max 模型，总花费不到 10 元人民币，效果优于 GPT5.5，略低于 Opus4.8。该测试展示了低成本下通过模型组合获得高性能的可行性，对预算有限的开发者和团队有参考价值。Qwen3.7-Max 作为阿里通义千问的最新模型，在性价比上表现突出。

AI模型 Qwen3.7-Max Claude GPT5.5 Opus4.8 模型对比

推荐理由：不到 10 元就能跑出接近 Opus4.8 的效果，做 AI 应用开发的团队值得关注这个低成本高性价比的模型组合方案。

5月31日

22:54

22:54

Viking@vikingmute

DeepSWE 对 Opus 4.8 的评分显示，该模型在性能上优于 Opus 4.7，且成本更低、效率更高，但相比 GPT5.5 仍有明显差距。作者表示尚未深度使用 4.8，仍在使用更便宜的 4.6 版本，并指出对基准测试已逐渐祛魅，更看重推特上的真实用户评价。目前普遍认为 GPT5.5 仍是大多数用户的最强模型。

AI模型 Opus 4.8 GPT5.5 模型评测成本效率基准测试

推荐理由：如果你在纠结是否升级到 Opus 4.8，这篇推文帮你省了试错成本——作者用真实体验告诉你，4.8 性价比提升但远不及 GPT5.5，做模型选型的开发者建议看看推文下的真实讨论。

5月28日

18:16

18:16

Viking@vikingmute

一位开发者分享了针对几千行大 PR 的 Code Review 最佳实践，使用 Codex GPT5.5、Composer 2.5 和 Deepseek V4 Pro 等多个模型共同审查，每个模型生成按优先级排序的 Bug 报告。然后让大模型汇总共性高优先级问题，人工确认后由 Claude 作为 fix agent 修复，再由 GPT5.5 作为 review agent 验证修复并留下批改意见，循环直至确认。最后全量跑 E2E 测试确保无回归。该方法发现了不少真实问题，未来将做成 skill 分享。

技巧 Code Review 多模型协作 GPT5.5 Claude Deepseek V4 Pro

推荐理由：做大型代码审查的团队可以借鉴这种多模型协作+人工确认的流程，能有效发现隐藏问题，建议尝试类似方案提升 Code Review 效率。