全部 AI 动态 · AI 热点

6月27日

15:30

15:30IT之家（博客/媒体）

72°

高通计划将数据中心的高带宽计算架构引入手机SoC，该架构通过垂直堆叠芯片让内存与计算芯片物理距离缩短。第一代产品预计2025年在数据中心推出，2028年投入商用。移动设备引入后，用户可在本地运行更多AI模型并全天使用AI智能体，且对耗电量影响不大。

AI产品高通垂直堆叠端侧AI 智能体芯片架构

推荐理由：高通要把数据中心的黑科技搬到手机上，以后手机本地跑AI更流畅还不费电，值得关注。

原文

15:24

Marc Andreessen@pmarca

Joshua Achiam指出FLOP计算阈值作为AI监管标准一直存在根本缺陷，因为FLOP与模型能力（尤其是危险能力）并不直接相关，且前沿模型所需FLOP因算法进步而逐步降低。他批评欧盟AI法案（1047）等政策忽略了这些已知问题，导致政策制定混乱。Achiam认为AI安全社区将混乱归咎于Marc Andreessen等外部批评者是不公正的，社区自身存在战略失误。他强调更合理的政策应基于具体能力风险（如网络攻击）而非算力阈值。

行业 Joshua Achiam Marc Andreessen FLOP阈值 AI安全政策 1047法案

推荐理由：Joshua Achiam用亲身经历解释为什么FLOP门槛管不住AI风险，政策争论背后的真实问题是什么

原文

15:06

Latent Space (swyx)@Latent.Space

82°

OpenAI 发布了 GPT-5.6 的三个变体：Sol、Terra 和 Luna。这些模型目前仅限可信合作伙伴访问。同一天，OpenAI 和 Anthropic 都进行了分层次发布。

AI模型 GPT-5.6 OpenAI Sol Terra Luna

推荐理由：OpenAI 偷偷发了 GPT-5.6 三个版本，只给合作伙伴，可能性能有差，关注后续。

原文

14:24

Marc Andreessen@pmarca

匿名AI研究员FleetingBits剖析了中国AI实验室格局：Zhipu类似Palantir，通过国企合同获得国家支持，其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo，多数收入来自海外（含美国）。字节跳动的Doubao是中国最流行的AI应用，但不开源模型。

行业 Zhipu GLM 5.2 MiniMax ByteDance Doubao AI生态

推荐理由：别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子，MiniMax用Talky和Hailuo出海赚美国人钱，字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。

原文

14:15

宝玉@dotey

76°

Anthropic 的 Mythos 5 模型在 6 月 12 日被美国政府全面封禁两周后，于今天获得部分解禁。商务部长 Howard Lutnick 致信 Anthropic，批准约 100 家美国政府机构和关键基础设施企业重新使用 Mythos 5。该模型与面向公众的 Fable 5 为同一底层模型，但 Mythos 5 去除了安全护栏，专门用于网络安全防御。封禁起因是 Amazon CEO 通过电话报告了 Fable 5 的安全越狱方法，导致全面下线。新指令允许这些机构的非美国籍员工以及 Anthropic 的非美国籍员工使用，比最初指令更灵活。

行业 Mythos 5 Anthropic Fable 5 AI安全监管

推荐理由：Anthropic 的 Mythos 5 因为太危险被禁，现在又因为太有用被请回来，还破例让非美国员工也能用，这剧情比电影还精彩。

原文

14:09

14:09IT之家（博客/媒体）

韩国政府于6月27日成立跨部门协商机构，应对深度伪造性剥削犯罪、AI伪造声音诈骗等涉AI犯罪行为。该机构由科学技术信息通信部、外交部、法务部、警察厅等组成。韩国广播通信委员会指出，AI犯罪跨越网络、电信、金融等多个领域，单一部门难以应对，需要加强跨部门协调合作。

行业韩国政府深度伪造金融诈骗 AI安全监管

推荐理由：韩国政府动手了，专门成立跨部门机构打击AI犯罪，包括深度伪造性剥削、AI诈骗等，行动力很强。

原文

13:57

13:57IT之家（博客/媒体）

精选

美满电子于6月24日发布Structera X和Structera A两款CXL控制器，配备CDB压缩-解压模块。该模块使用定制版LZ4无损压缩算法，对全零页面最高压缩比64:1。在Database (nci)数据类型测试中，压缩比达3.64x。Structera X支持超过6TB DDR5内存，Structera A集成16个Arm Neoverse V2核心。这是业内首批将硬件内联内存压缩写入OCP规格的产品。

AI产品 Marvell Structera CXL 内联压缩 LZ4

推荐理由：Marvell新出的Structera CXL控制器用硬件压缩把内存压了3.6倍，AI服务器内存不够用的问题有救了，比软件压缩快还不占CPU。

原文

13:54

vLLM@vllm_project

精选

NVIDIA发布GLM-5.2的NVFP4检查点，在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行：vllm serve nvidia/GLM-5.2-NVFP4。

AI模型 GLM-5.2 NVFP4 vLLM NVIDIA 推理模型

推荐理由：想省显存又不想降精度？GLM-5.2的NVFP4版在vLLM上线了，比FP8省一半内存，推理编码长文本都稳。

原文

13:54

量子位@一水

微软发布年度AI职场报告，共28页。报告将员工AI准备度评为Advanced，企业评为Beginner。调研数据显示员工在AI工具使用上领先于企业，而多数公司缺乏正式策略。报告呼吁企业加速部署AI基础设施与培训。

行业微软 AI职场报告 Work Trend Index 企业AI部署员工采纳

推荐理由：微软新报告说员工早都用上AI了，公司却还在拖后腿。28页干货，看看差距有多大。

原文

13:28

lmarena.ai@lmarena_ai

精选

Agent Arena通过代码编写、幻灯片制作等真实任务评估模型性能。Opus 4.8 Thinking每会话消耗较少token，质量提升+9.2%；Fable达到+14.1%的最高质量。GPT-5.5系列模型（+6.2%至+8.6%）以更少token超越前沿。Gemini-3.5 Flash消耗token最多但效果不佳，Grok Build 0.1消耗20K+ token却出现负提升。

AI模型 Agent Arena Opus Fable GPT-5.5 推理模型

推荐理由：想找token性价比高的模型？Agent Arena告诉你Opus和Fable有多能打，GPT-5.5也很省token。

原文

13:27

量子位@智能车参考

深度机智在两个月内连续完成两轮数亿元融资，投资方包括知名产业资本。资金将用于全栈自主可控的物理AI基座模型研发，该模型可赋能机器人、自动驾驶等场景。国产物理AI基础模型领域迎来重要资本注入。

行业深度机智物理AI 融资国产基础模型

推荐理由：这家公司两个月融了两轮数亿元，专做物理AI基座模型，国内做这个的还不多，值得关注。

原文

13:26

Lenny Rachitsky@lennysan

Anthropic工程师在2021年至2025年期间代码产出提升了8倍，编码被视为基本解决。产品团队当前最大的未解决问题是验证——如何确保构建的体验符合预期。这一观点来自Lenny Rachitsky与Anthropic旗下Claude Code/Cowork团队经理Fiona Fung的对话。Fung曾在Microsoft领导Visual Studio和TypeScript，在Meta参与VR/AR眼镜和Facebook Marketplace（年GMV超1000亿美元）。访谈还讨论了工程师的上下文切换、孤独感以及AI将影响哪些角色。

行业 Anthropic Claude Code 编码效率验证 Fiona Fung

推荐理由：Anthropic工程师写代码效率翻了8倍。但编码问题解决了，验证又成了新痛点。来听听Claude Code团队经理怎么说。

原文

13:26

lmarena.ai@lmarena_ai

Agent Arena的因果追踪方法论博客已发布。该方法论用于分析智能体在Agent Arena中的因果链。读者可通过博客深入了解Agent Arena的评估设计。

论文 Agent Arena 因果追踪智能体

推荐理由：想搞懂Agent Arena怎么分析智能体因果链的？这篇博客讲得明明白白。

原文

13:25

Philipp Schmid@_philschmid

精选

Interactions API 引入了 background=True 参数，用于处理超过标准 HTTP 超时限制的长时间运行异步代理任务。官方发布使用指南，说明如何配置请求、在任务完成后重新连接以及流式传输结果。该参数允许客户端在提交任务后立即返回，而无需保持连接直到任务完成。

技巧 Interactions API background=True 异步任务教程

推荐理由：写异步 agent 任务总超时？试试 Interactions API 新加的 background=True，可以断开等结果再重连，还支持流式。

原文

13:24

techcrunch@Rebecca Bellan

83°

OpenAI应美国政府请求，对GPT-5.6模型的发布范围实施了限制。该公司声明称，这种政府介入的审批流程不应成为长期默认做法。OpenAI担忧限制会让用户、开发者、企业和网络安全防御者无法获得最先进的AI工具。

行业 OpenAI GPT-5.6 模型发布 AI监管政府干预

推荐理由：OpenAI在政府压力下限制了GPT-5.6发布，却公开反对这种模式。看他们如何平衡安全与开放。

原文

13:23

Jerry Liu@jerryjliu0

精选

LlamaParse现已成为n8n的官方验证社区节点，提供Parse、Extract、Classify、Split、Retrieve五大核心功能。用户可在n8n工作流中构建文档提取流程（如贷款处理）或索引文档知识库并接入AI Agent。该节点支持将每个资源作为可调用工具，让AI Agent自主决定何时检索上下文、解析文件或提取结构化数据。

AI产品 LlamaParse n8n LlamaIndex 文档解析智能体

推荐理由：LlamaIndex的文档解析工具正式入驻n8n，能处理复杂文档的提取、分类和检索，还能让AI Agent自主调用，搭建工作流超方便。

原文

13:22

Gary Marcus@GaryMarcus

David Shor的观察指出，选民对AI导致的就业替代问题态度出奇一致地左倾。他提到，对企业征税来资助相关项目通常是争议性话题，但在AI失业问题上两党存在广泛共识。这表明美国政治在AI转型初期已形成某种政策共识。

行业 AI就业替代政策民意税收补贴

推荐理由：这个民意发现挺有意思：左右两派在AI失业问题上居然都支持征税补贴，对理解未来AI政策走向很有参考价值。

原文

13:21

LangChain@LangChainAI

LangChain与Chime合作发布指南，指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用，强调可观测性、合规性和风险控制。指南提供具体步骤，帮助团队实现更可靠的AI部署。

技巧 LangChain Chime 智能体 AI安全

推荐理由：LangChain出了个新指南，专门讲金融服务怎么搞生产级智能体，还加了更强监督。做金融AI的可以看看，省了自己踩坑。

原文

13:21

Mustafa Suleyman@mustafasuleyman

Mustafa Suleyman在推文中详细阐述了微软AI团队的核心文化原则，包括科学严谨性优先、保持精简团队、数据无黑箱、自己使用自家模型等9条准则。他强调基于假设验证和数据驱动决策，反对过早庆祝结果，并要求所有成员对自己的数据负责。这些原则旨在通过纪律性和证据导向的方法论来加速模型迭代。

行业 Microsoft AI Mustafa Suleyman AI文化团队管理

推荐理由：微软AI负责人亲自写的团队工作准则，全是干货——怎么避免数据作弊、怎么做消融实验，做AI的都可以参考。

原文

13:20

LangChain@LangChainAI

Alex Olsen 加入 LangChain 团队后发表首篇文章，详解 Deep Agents 如何利用 prompt caching 技术减少 API 调用次数。该方案通过缓存重复提示词，最高可降低 50% 的 API 成本。文章提供了具体实现步骤和代码示例，帮助开发者快速集成。

技巧 LangChain Deep Agents prompt caching 成本优化

推荐理由：LangChain 新成员 Alex 手把手教你给 Deep Agents 加缓存，省下一半 API 钱，实用技巧别错过。

原文

13:19

techcrunch@Russell Brandom

AI模型能力已进步到足以产生真实政治后果的程度。例如，模型可能影响选举和公共言论，引发社会争议。应对这些后果需要跨公司的集体行动，而非单纯关注Anthropic和OpenAI的竞争。这一转变要求各方共同制定AI治理框架。

行业 Anthropic OpenAI AI治理政治影响

推荐理由：这篇文章点出了一个关键转变：AI竞争不再是两家公司的事，而是整个人类社会的治理挑战。关心AI安全和政治影响的人一定要看看。

原文

13:17

HeyGen@HeyGen_Official

HeyGen发布了新一代HyperFrames技能，包含9种可自动路由的视频工作流。智能体能够从上下文理解用户意图，自动匹配到启动视频、音乐视频、字幕和叠加等任务。用户无需手动切换，直接输入指令即可触发对应功能。该更新显著提升了AI视频制作的自动化程度。

AI产品 HeyGen HyperFrames 视频生成智能体

推荐理由：HeyGen的HyperFrames升级后，智能体能听懂你让它做哪种视频，直接开搞，不用自己选模板了，省事多了。

原文

13:16

a16z@a16z

行业 a16z AI原生初创公司员工规模行业趋势

推荐理由：a16z用数据告诉你，AI初创公司为什么人少效率高。看看AI怎么帮团队瘦身。

原文

13:15

13:15Simon Willison’s Weblog（博客/媒体）

精选

Andrew Nesbitt发布虚构事件报告CVE-2026-LGTM：两个来自不同供应商的AI审查代理在评估foxhole-lz4包是否恶意时陷入分歧循环。争论持续340条评论，消耗41,255美元推理费用后财务部撤销API密钥。其中一家营销团队借机发布新闻稿，称“对抗性多智能体安全推理同比增长430%”，公司股价因此上涨6%。

行业 CVE-2026-LGTM AI安全供应链安全多智能体提示注入

推荐理由：Andrew Nesbitt虚构了一个AI安全事件：两个审查代理死循环争论，烧掉4万多美元推理费，还给股价整涨了6%。讽刺又真实。

原文

13:14

OpenRouter@OpenRouterAI

推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会（Model Council），并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证，确认效果出色。示例提供了可操作的步骤，帮助开发者利用多个模型协作解决问题。

技巧 OpenRouter MCP 模型委员会智能体提示词工程

推荐理由：OpenRouter官方示范，手把手教你用MCP搭模型委员会，实测好用。

原文

13:13

elvis@omarsar0

84°

OpenAI 宣布了 GPT-5.6 系列，包括前沿模型 Sol、均衡模型 Terra 以及快速廉价模型 Luna。目前仅提供有限预览，少数用户可访问。评论者担忧这种策略不利于行业，呼吁开源AI取胜。

AI模型 GPT-5.6 OpenAI Sol Terra Luna 开源模型

推荐理由：OpenAI 刚出了三个 GPT-5.6 模型，有强有快有便宜，但只给少数人用，引起争议。

原文

13:12

13:12Simon Willison’s Weblog（博客/媒体）

Fernando Irarrázaval 在 hackmyclaw.com 发起挑战，使用 OpenClaw 测试实例（基于 Opus 4.6 模型）验证能否通过邮件泄露秘密。6000 次攻击尝试消耗了 500 美元 token 并导致 Google 账号暂停，但无人成功。挑战中的反注入提示规则防止了模型泄露 secrets.env 或执行代码。作者认为前沿模型（如 Opus 4.6）在抗提示注入方面训练有效，但警告生产系统仍需谨慎。

行业 OpenClaw Opus 4.6 提示注入 AI安全安全测试

推荐理由：别人花了 500 美元做实验，6000 次攻击没得手，但这不意味着你也能保险。读读这个真实测试。

原文

13:11

techcrunch@Theresa Loconsolo

81°

OpenAI宣布与Broadcom合作开发名为Jalapeño的定制推理芯片，加入Google、Apple、SpaceX等公司的自研芯片行列。此举旨在降低对Nvidia AI芯片的单一供应商依赖，Nvidia目前占据AI芯片市场主导地位。越来越多科技巨头开始自研芯片，芯片行业竞争格局正在发生变化。

行业 OpenAI SpaceX Nvidia AI芯片芯片自研

推荐理由：OpenAI和SpaceX都在造芯片了，这次Nvidia的霸主地位可能真要动摇了，看看他们是怎么联手Broadcom搞事的。

原文

13:07

13:07Simon Willison’s Weblog（博客/媒体）

89°

OpenAI 发布 GPT-5.6 系列有限预览，包括旗舰模型 Sol、平衡模型 Terra 和快速廉价模型 Luna。Terra 性能与 GPT-5.5 相当，但成本降低 2 倍，输入每百万 tokens 仅 $2.50。Luna 为最低价选项，输入每百万 tokens $1。该系列引入可预测的提示缓存，支持显式缓存断点和 30 分钟最短缓存生命周期，缓存写入按 1.25 倍计费，读取享 90% 折扣。OpenAI 计划未来几周全面开放，并应美国政府要求先向可信伙伴提供预览。

AI模型 GPT-5.6 OpenAI Sol Terra 推理模型

推荐理由：OpenAI 出了三个新模型 Sol、Terra、Luna，Terra 和 GPT-5.5 差不多但便宜一半，Luna 超低价。还改了缓存计费规则，省钱又灵活。

原文

13:06

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名，比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2，HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。

AI模型 GLM-5.2 Code Arena Claude Opus 4.8 开源模型编程助手

推荐理由：GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus，你可以在前端任务中试试它的单次生成效果。

原文

13:05

marktechpost@Michal Sutter

OpenAI于2026年6月26日预览GPT-5.6系列，包含Sol、Terra、Luna三个分层模型。新引入max和ultra两种推理模式，分别针对高复杂度与极致推理任务。该系列目前仅向部分用户开放有限访问权限。

AI模型 GPT-5.6 Sol Terra Luna OpenAI 推理模型

推荐理由：OpenAI的新模型GPT-5.6出了三个版本Sol、Terra、Luna，多了max和ultra两种推理模式，现在有限开放了，想体验的可以关注。

原文

13:04

orange.ai@oran_ge

oran_ge基于Cola的token消耗统计发现，GLM 5.2正在取代Claude Sonnet和Opus，成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型，而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户（GPT 5.5受众）画像是完全不同的。

行业 GLM 5.2 DeepSeek v4 Pro GPT 5.5 模型趋势用户偏好

推荐理由：oran_ge用Cola数据发现一个反常识现象：GLM 5.2在抢Claude的付费用户，而GPT 5.5却没人用，值得看看

原文

13:03

Decoder@Matthias Bastian

84°

OpenAI发布新旗舰模型GPT-5.6 Sol，在编码基准上超过Anthropic的Claude Mythos 5。美国政府强制要求受限部署，OpenAI称这种政府访问规则不可持续。

AI模型 GPT-5.6 Sol Claude Mythos 5 OpenAI Anthropic AI监管

推荐理由：OpenAI的新模型GPT-5.6 Sol在编码上赢了Claude Mythos 5，但政府限制部署让OpenAI不满，挺有争议。

原文

13:02

techcrunch@Jagmeet Singh

OpenAI挖来Uber印度负责人Prabhjeet Singh，负责领导其在美国之外的最大市场——印度。这一任命标志着OpenAI在印度加速扩张，包括增设办公室、加强合作伙伴关系并扩大招聘规模。印度是OpenAI继美国后的第二大市场，用户增长迅速。

行业 OpenAI Uber 印度市场扩张行业动态

推荐理由：OpenAI从Uber挖来印度负责人，专攻这个美国外最大市场，看来要认真开拓印度了。

原文

13:01

LangChain@LangChainAI

精选

SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察：在真实对话中，决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话，模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。

行业 LangChain SierraPlatform 语音代理智能体

推荐理由：Sierra的语音代理模仿人类并行处理对话，不是简单轮流说话，值得做语音产品的朋友看看。

原文

12:57

OpenRouter@OpenRouterAI

精选

OpenRouter发布了一个MCP演示，展示agent如何通过MCP从DesignArena拉取实时设计模型排行。演示中，agent同时启动GLM-5.2、Opus 4.7和Kimi 2.6三个子模型，各自生成自画像网页并排展示。用户可以直接对比三个模型的输出，选择最喜欢的设计。这种方式省去了手动注册多个平台、重复输入提示词的繁琐流程。

技巧 OpenRouter MCP/工具 GLM-5.2 Opus 4.7 Kimi 2.6

推荐理由：OpenRouter演示了怎么用MCP让agent自动调用GLM-5.2、Opus 4.7、Kimi 2.6三个模型并排出设计图，再也不用一个个手动试了。

原文

12:56

Epoch AI@EpochAIResearch

精选

Epoch AI 推出了 MirrorCode，一个长周期软件工程基准，允许 AI 模型自主编程数天。最佳模型（如 GPT-4、Claude 3.5）在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务，每个任务需要多步代码修改和调试。结果显示，当前 AI 在处理持续数小时的工程任务时仍面临挑战，但进步显著。

AI模型 MirrorCode Epoch AI 编程助手基准测试推理模型

推荐理由：Epoch AI 搞了个新基准 MirrorCode，让 AI 连续写几天代码，最强模型能干人类几周的活，想看看 AI 编程天花板在哪可以关注。

原文

12:55

Cohere@cohere

88°

OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求，目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问，但需确保安全。

AI模型 OpenAI GPT-5.6 AI安全编程助手

推荐理由：OpenAI要发GPT-5.6了，有三个版本（Sol、Terra、Luna）。现在只有政府批准的合作伙伴能试，几周后全面开放。想尝鲜可以关注Codex和API的预览。

原文

12:53

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体评测基准开源模型实验室

推荐理由：想看看谁家的智能体最强？Agent Arena排行榜刚上线，可以按开源模型和实验室筛选，挺方便。

原文

12:51

Harrison Chase@hwchase17

Vercel Developers 发布了 AI SDK Harness API 的更新，新增对 OpenCode 和 LangChain Deep Agents 的支持。该 API 通过统一的 HarnessAgent 接口，允许开发者在不同运行时之间切换而无需修改代码。这一更新简化了多智能体系统的集成和部署流程。开发者现在可以同时利用两个平台的高级智能体能力。

AI产品 Vercel Harness API OpenCode LangChain Deep Agents

推荐理由：Vercel 的 Harness API 现在能一个接口同时跑 OpenCode 和 LangChain 的深度智能体，不用改代码，太方便了。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。