全部 AI 动态 · AI 热点

6月30日

10:57

10:57

arXiv: Anthropic@Carson Rodrigues, Oysturn Vas

该论文基于15个独立MCP服务器（5个来自ANSYR语音AI平台，10个来自官方注册表），识别出五种架构模式：Resource Gateway、Tool Orchestrator、Stateful Session Server、Proxy Aggregator和Domain-Specific Adapter。定量评估包括分类法跨两个LLM评分者的Cohen's kappa为0.76，并定位了三处模式边界模糊问题。端到端传输开销测量了环回和跨主机路径。工具计数研究显示Claude Haiku 4.5在10-15个工具时工具选择准确率低于90%，Sonnet 4在20-30个工具时准确率下降。

论文 MCP Claude Haiku 4.5 Sonnet 4 架构模式工具选择

推荐理由：想给LLM挂外部工具？这篇论文把MCP服务器架构拆成五种模式，还有反模式和性能数据，Claude Haiku和Sonnet用户值得看看。

6月17日

11:58

11:58

arXiv cs.LG@Mohammadreza Rashidi

该论文分析了Handlebars模板引擎中双花括号{{x}}和三角花括号{{{x}}}对LLM提示注入的影响。双花括号HTML转义尖括号但不转义方括号、冒号或Markdown井号，导致ChatML、Llama-3和XML分隔符存活率为0.00，而Llama-2 [INST]、Human:/Assistant:和Markdown ###分隔符存活率为1.00。在5760次试验中，GPT-3.5 Turbo在原始插值下任务劫持成功率达97%，在转义下为91%。Claude Haiku 4.5几乎完全抵抗两种攻击。转义默认值仅对HTML转义覆盖的分隔符方案有效，无法替代指令与数据的结构化分离。

论文 Handlebars LLM提示注入 GPT-3.5 Turbo Claude Haiku 4.5 提示工程安全

推荐理由：这篇论文用具体数据告诉你，Handlebars的{{}}和{{{}}}差别有多大，以及为什么别指望HTML转义防注入。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？