全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

23:56

23:56

elvis@omarsar0

精选72°

一项新研究挑战了自我进化智能体的普遍假设，即更强的模型能写出更好的提示和技能编辑。实验表明，模型生成进化更新的能力在不同能力级别上基本持平，Qwen3.5-9B与Claude Opus 4.6表现相当。而受益于这些更新的能力呈倒U型曲线，中等模型效果最佳，弱模型无法激活更新，强模型改进空间有限。因此，建议将廉价模型用于进化器角色，昂贵模型用于求解器角色，以最大化收益。该发现对构建长期任务智能体的开发者具有重要指导意义。

论文智能体自我进化模型选择研究论文成本优化

推荐理由：这篇研究戳破了“大模型=好进化器”的直觉误区，做智能体开发的团队可以重新分配预算——用便宜模型写更新，贵模型做执行，效果反而更好。

5月27日

11:08

11:08

AI Will@FinanceYF5

精选

一项基于2691人的实验揭示了AI使用的三层认知偏差：人们实际使用AI的频率高于自我报告，且对AI节省时间的预期高于实际效果。使用AI后，这些偏差反而会加深，形成认知反馈循环。研究指出，AI在简单任务中的收益被显著高估。

论文效率增益幻觉认知偏差用户行为研究论文

推荐理由：看看你高估AI多少

5月20日

15:38

15:38

arXiv cs.AI@Saurav Ghosh, Gabriella Polach, Abdou Sow

精选

这篇论文研究了结构化提示设计是否能提升大语言模型的回答质量并减少用户交互成本。研究者对比了三种提示条件：原始提示、清单改进提示和澄清问题提示，在摘要、规划、解释和编程四种任务上测试了ChatGPT、Claude和Grok三个模型。结果显示，清单改进提示的平均评分最高（7.50/8），远超原始提示（5.67）和澄清问题提示（6.67），且使用的token数更少。研究表明，简单的提示清单就能显著提升回答质量并减少不必要的来回交互。

论文提示工程结构化提示清单提示 LLM 研究论文

推荐理由：做AI提示工程或日常使用LLM的开发者，用清单提示法能直接提升输出质量并省去反复调试的麻烦，建议试试这个简单但有效的技巧。

5月17日

16:36

16:36

Gary Marcus@GaryMarcus

一项新研究揭示，即使经过超万亿美元的投资，LLM智能体的记忆系统仍存在根本性缺陷。研究发现，持续更新的记忆（如压缩后的可复用记忆）不仅无法提升性能，有时甚至比完全没有记忆的表现更差，包括在已解决过的问题上。相比之下，保留原始片段的“情景记忆”更为可靠。这表明当前模型尚无法从经验中学习可复用的抽象知识，而这正是智能体持续改进的关键能力。

论文 LLM智能体记忆机制可靠性研究论文持续学习

推荐理由：做AI智能体开发的团队值得关注——记忆机制是当前瓶颈，这篇论文直接挑战了“记忆越多越好”的假设，看完会重新思考你的记忆策略。