全部 AI 动态 · AI 热点

6月19日

09:34

arXiv: DeepSeek@Ruiyang Ma, Teng Ma, Junru Li, Hantian Zha, Xuchun Shang, Qingda Hu, Zheng Liu, Xinjun Yang, Tao Ma, Guojie Luo

精选71°

长上下文LLM推理的内存瓶颈日益突出。传统RDMA解耦内存池对于稀疏注意力模型效率低下，仍需完整获取KV缓存。SAC系统利用CXL的低延迟、缓存行粒度加载/存储语义，仅在推理时按需获取所需的top-k KV条目。在DeepSeek-V3.2上使用SGLang的评估显示，相比RDMA基线，SAC实现了2.1倍吞吐量提升、9.7倍TTFT降低和1.8倍TBT降低。

论文 SAC CXL KV缓存稀疏注意力 DeepSeek-V3.2

推荐理由：长上下文推理，内存传输是瓶颈。新方案SAC用CXL按需取KV缓存，比RDMA吞吐量翻倍、延迟降到十分之一，做稀疏推理的值得一看。

原文

6月18日

09:25

arXiv: DeepSeek@Jingkun Luo, Yifan Sun, Da-Tian Peng, Guanxiong Pei

SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题，在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档，由DeepSeek-V3.2和Kimi K2生成，并引入困惑度一致性过滤。在跨域迁移最难协议下，SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现，即使经困惑度过滤后，AI插入的句子长度仍存在生成器依赖的差距。

论文 SenFlow MOSAIC DeepSeek-V3.2 Kimi K2 AI生成文本检测

推荐理由：这篇论文用SenFlow模型做混合人机文本检测，在MOSAIC基准上比现有方法高出4个多点的F1分数，还发现AI句子有长度特征。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

11:57

arXiv: DeepSeek@Tai Tran Tan, An Dinh Thien

该论文描述了SemEval-2026 Task 6的系统，针对美国总统采访中的政治回避策略分类。比较了两种范式：使用QLoRA对Qwen3（4B-32B）进行参数高效微调，以及使用结构化CoT提示推理模型DeepSeek-V3.2和Grok-4-Fast。Grok-4-Fast在子任务2（9类回避）上取得Macro F1 0.5147，子任务1（3类清晰度）上0.7979，分别排名第8和第13。消融实验表明层次化标签和少样本示例提升了效果，但最强提示变体间Macro F1无显著差异。

论文 Grok-4-Fast DeepSeek-V3.2 Qwen3 推理模型政治回避检测

推荐理由：想知道怎么用CoT提示检测政治回避？这篇论文拿Grok-4-Fast跑出了0.51的F1，比微调Qwen3强，还分析了怎么设计提示最有效。

原文

6月12日