全部 AI 动态 · AI 热点

6月25日

03:51

03:51

Greg Brockman@gdb

Jalapeño是一款全新设计的芯片，专为大语言模型推理优化，开发周期长达九个月。其能效比（perf/watt）根据发布方宣称表现惊人。目前尚未公布具体基准测试数据或对比结果。

AI产品 Jalapeño LLM推理芯片能效比

推荐理由：gdb团队搞了个新芯片Jalapeño，专门跑大模型推理，说能效比特别猛，想了解硬件新动向的可以看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

13:04

13:04

AK@_akhaliq

SpenseGPT提出一种实用的一次性剪枝方法，在LLM推理中同时支持稀疏和密集通用矩阵乘法（GEMM）。该方法无需重新训练，仅通过一次剪枝即可大幅减少模型参数。实验表明，在保持模型精度的前提下，剪枝后模型推理速度提升可达2倍。该技术适用于多种主流LLM架构。

论文 SpenseGPT 剪枝 LLM推理 GEMM 模型压缩

推荐理由：一次剪枝，推理快两倍

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

00:20

00:20

DeepLearning.AI@DeepLearningAI

DeepLearning.AI 与 RedHat 合作推出免费短课程《Fast & Efficient LLM Inference with vLLM》，由 Cedric Clyburn 授课。课程涵盖开源 LLM 量化、使用 vLLM 部署模型，以及从速度、成本和准确率三个维度进行基准测试。学员可免费注册学习，适合希望提升 LLM 推理效率的开发者。

AI产品 vLLM LLM推理模型量化 RedHat 课程

推荐理由：vLLM 是目前最主流的 LLM 推理框架之一，这门课直接教你量化、部署和基准测试，做模型部署或推理优化的工程师值得花时间学。

5月30日

16:44

16:44

Stanford AI Lab@StanfordAILab

斯坦福AI Lab在ICLR 2026上公布了其论文列表，涵盖LLM推理、智能体系统、AI安全、机器人、空间智能、视频生成等多个前沿方向。这些论文代表了该实验室在AI领域的最新研究成果，对学术界和工业界均有重要参考价值。参会者可以现场交流，未参会者也可在线查看论文详情。

论文 ICLR 2026 斯坦福AI Lab LLM推理智能体 AI安全

推荐理由：斯坦福AI Lab的论文列表是了解AI前沿趋势的绝佳窗口，做LLM推理、智能体或AI安全的研究者值得点开看看，说不定能找到灵感或合作方向。