精选 AI 资讯 · AI 热点

6月18日

03:01

03:01Anthropic: Research（资讯）

精选

Anthropic前沿红队发布研究，量化了GPT-4和Claude 3.5等大模型对N-day漏洞利用的效率影响。测试涉及多个已知漏洞样本，发现模型能显著缩短利用代码的编写时间。研究报告同时强调了当前安全对齐的不足，并给出了缓解建议。

论文 Anthropic Claude GPT-4 漏洞利用 AI安全

推荐理由：Anthropic自家红队实测，发现Claude和GPT-4都能帮人更快写出漏洞利用代码。想知道风险多大？看这篇。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月25日

21:38

21:38

Simon Willison@simonw

精选

Simon Willison 在 X 上指出，此前广为流传的“每生成一封邮件消耗一瓶水”的 GPT-4 水耗估算，很大程度上基于对 GPT-4 架构的猜测。他认为 OpenAI 有责任公布这个已退役的三年老模型的架构细节，以澄清事实。该言论引发了对 AI 模型环境影响估算准确性的讨论。

行业 GPT-4 环境影响水耗 OpenAI 架构公开

推荐理由：AI 环境影响是开发者绕不开的话题，Simon Willison 戳破了 GPT-4 水耗估算的泡沫，做 AI 可持续性研究的团队值得关注。

5月18日

06:44

06:44

Ethan Mollick@emollick

精选

Ethan Mollick在推文中透露，他们的实验使用了GPT-4和GPT-4o的混合模型，因为发表论文需要时间。他指出，如果使用更新的模型，尤其是最新的智能体工具，实验结果可能会更加显著。这表明AI技术的快速迭代对研究结果有重要影响，最新模型和工具能带来更大提升。

论文 GPT-4 GPT-4o 实验模型迭代智能体

推荐理由：AI研究者或实验设计者注意了：模型版本差异可能显著影响结论，使用最新智能体工具能放大效果，建议在论文中明确标注模型版本。