全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月23日

11:52

AI Will@FinanceYF5

过去一周内，多家AI基础设施初创公司表现亮眼，包括Modal、Cerebras、Exa和TurboPuffer。这些公司分别在算力、搜索、数据处理等关键领域取得突破，显示出AI基础设施赛道的强劲增长势头。投资者和开发者应关注这一趋势，它可能改变AI应用的底层支撑格局。

行业 AI基础设施 Modal Cerebras Exa TurboPuffer

推荐理由：AI基础设施是当前最热赛道之一，Modal、Cerebras等公司一周内集体爆发，做AI应用或模型训练的团队值得关注，可能找到更高效、低成本的底层方案。

原文

11:51

AI Will@FinanceYF5

近期，多家AI基础设施初创公司表现出色，包括Modal、Cerebras、Exa和Turbopuffer等。这些公司在上周内均有重要进展或成果发布，显示出AI基础设施领域的活力和增长潜力。这一趋势表明，AI应用对底层计算、数据检索和存储的需求正在快速上升，相关初创公司正成为行业关键参与者。

行业 AI基础设施初创公司 Modal Cerebras Exa

推荐理由：AI基础设施是当前最热门的赛道之一，关注这些初创公司的动态能帮你把握技术趋势和投资机会。做AI应用或模型训练的团队，值得了解这些新玩家的产品和服务。

原文

05:51

rohanpaul_ai@rohanpaul_ai

Cerebras 宣布其晶圆级芯片在 1 万亿参数的 Kimi K2.6 模型上达到了 981 tokens/sec 的推理速度，经 Artificial Analysis 验证，比最快的 GPU 云快 6.7 倍。传统 GPU 集群因跨芯片拆分模型导致大量数据传递延迟，而 Cerebras 的晶圆级芯片将整个处理器构建在单个硅晶圆上，片上路由带宽更高、延迟更低。这一速度优势对于企业级编程智能体等需要快速迭代测试和调试的场景尤为关键。Cerebras 声称其真正的商业价值不在于单纯的速度，而在于能在足够大的模型上实现这种速度，从而支撑企业级应用。

AI产品 Cerebras Kimi K2.6 推理速度晶圆级芯片企业级智能体

推荐理由：做企业级 AI 推理或编程智能体的团队，如果被 GPU 集群的延迟和带宽瓶颈困扰，Cerebras 的晶圆级方案值得关注——它用硬件架构创新解决了模型权重和激活值传输的痛点，实测数据比 GPU 云快一个数量级。

原文

02:47

AI Engineer@aiDotEngineer

精选

Codex Spark生成代码速度达1200 tokens/秒，而Sonnet和Opus仅40-60 tokens/秒，快了约20倍。Cerebras的@MilksandMatcha指出，若开发者习惯不佳，更快速度只会导致更快生产坏代码。他提供了实用指南视频，帮助适应高速生成。

技巧 Codex Spark Sonnet Opus Cerebras 编程助手

推荐理由：Cerebras教你避免快速写坏代码

原文

5月22日

01:20

rohanpaul_ai@rohanpaul_ai

OpenAI 联合创始人 Greg Brockman 在播客中透露，2017 年团队开始认真思考如何实现 AGI 时，发现算力需求远超预期。他们接触了 Cerebras 等公司，意识到需要大量专用硬件和大型数据中心。非营利筹款存在上限，无法支撑如此巨大的投入。因此，Elon Musk、Sam Altman、Ilya Sutskever 和 Brockman 一致同意，必须创建营利实体才能继续推进 AGI 使命。这一决策标志着 OpenAI 从非营利根基转向混合结构，也揭示了 AI 研发中算力成本的关键作用。

行业 OpenAI AGI 算力非营利转营利 Cerebras

推荐理由：这段内部决策过程揭示了 AI 研发中算力成本如何倒逼组织变革，对关注 AI 产业趋势和创业模式的读者有启发——非营利模式在资本密集型领域可能行不通。

原文

5月20日

09:08

shao__meng@shao__meng

76°

Cerebras 宣布为 Moonshot AI 的 Kimi K2.6 模型（超 1T 参数）提供企业级高速推理服务，速度达到约 1000 tokens/s，成为 Artificial Analysis 评测中速度最快的前沿模型。此前 Kimi K2.5 和 K2.6 虽模型能力强，但官方推理速度慢，而 Groq 被 Nvidia 收购后未再跟进主流模型推理。Cerebras 继为 GPT 5.3 Codex Spark 提供高速推理后，再次解决大型模型的推理瓶颈，让开发者能更高效地使用该模型。

AI产品 Kimi K2.6 Cerebras 高速推理企业级推理模型

推荐理由：Kimi K2.6 终于有了匹配其模型能力的高速推理平台，做推理密集型应用或需要实时响应的开发者可以直接用起来，体验 ~1000 tokens/s 的流畅感。

原文

07:10

Clement Delangue@ClementDelangue

精选

Cerebras 正在企业测试中运行 Kimi K2.6，这是一个万亿参数模型。据 Artificial Analysis 测量，其推理速度约为每秒1000个 token，是迄今最快的前沿模型性能。这反驳了此前认为开源大模型无法快速运行的质疑。

AI模型 Cerebras Kimi K2.6 推理速度开源模型

推荐理由：Cerebras 让万亿参数模型跑出千 token 每秒

原文

5月14日

10:56

10:56IT之家（博客/媒体）

据彭博社报道，Arm 及其控股股东软银在 Cerebras 预计进行 IPO 前数周曾表达收购意向，但被 Cerebras 拒绝。Cerebras 是一家晶圆级 AI 推理解码加速器制造商，有望创下今年全球 IPO 规模纪录。该公司近日两次上调股票发行价格至每股 185 美元，预计筹集 55.5 亿美元，市值约 400 亿美元。这一事件凸显了 AI 芯片市场的激烈竞争和 Cerebras 的独立发展决心。

行业 Cerebras Arm 软银 AI 芯片 IPO

推荐理由：Cerebras 拒绝软银和 Arm 的收购，选择独立 IPO，这对关注 AI 芯片赛道和半导体投资的读者来说是一个重要信号——晶圆级 AI 加速器的市场价值正在被重估，值得关注其后续上市表现。

原文