全部 AI 动态 · AI 热点

6月28日

00:56

berryxia@berryxia

精选

Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件，效果超过复杂Prompt工程。第二层是记忆工具，让Agent自主读写更新，判断力比人强。第三层Skills实现渐进式披露，类似从书架抽词典。第四层把记忆建模为文件系统，用bash/grep，无需向量数据库。还引入"做梦"（带外异步处理）分析跨会话模式，已在生产中提升任务效率并降低成本。

技巧 Claude Code 记忆管理智能体 Anthropic 提示词工程

推荐理由：Anthropic官方分享了他们怎么让Agent记住东西：从Markdown文件到做梦机制，很实用的四层方法论，看完可以少走弯路。

原文

00:49

Geek@geekbb

73°

DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩：LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%，超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文，并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署，引发社区期待。

AI模型 DeepSeek Pro Max 编码基准开源模型

推荐理由：DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6，分数拉满，但还没开放下载，先来围观一下。

原文

00:19

elvis@omarsar0

Eve 是一款专注于快速构建智能体的工具，主打直观和可定制。用户反馈其界面简单易用，无需复杂编程即可上手。经过一周实际使用，早期体验者认为它确实能稳定运行。

AI产品 Eve 智能体工具 No-Code

推荐理由：想玩智能体又怕麻烦？试试Eve，特直观，随便拖拽就能搭起来，真心好用。

原文

00:01

MIT CSAIL@MIT_CSAIL

一份由Anatoli Kopadze整理的18步Claude使用教程发布。教程涵盖从基础提示到高级工作流的技巧，共18个步骤。每个步骤针对Claude交互中的具体场景提供指导。用户可系统提升与Claude的协作效率。

技巧 Claude Anthropic 提示词工程教程

推荐理由：想用好Claude？这有18个实用步骤，从提示词到工作流全涵盖，练完你就是高手。

原文

6月27日

23:12

歸藏(guizang.ai)@op7418

精选

Seedance 2.0 新增原生4K分辨率生成，文字清晰度显著提升。用户@op7418用 Codepilot 宣传片对比，4K 版文字边缘锐利，材质质感远超1080P超分结果。该版本展示了4K视频生成在文字渲染上的突破。

AI产品 Seedance 2.0 4K 视频生成 Codepilot 文字清晰度

推荐理由：Seedance 2.0 原生4K出片，文字清晰度实拍太猛了，比超分强一大截。

原文

23:12

歸藏(guizang.ai)@op7418

Seedance 2.0 原生支持 4K 分辨率生成视频，文字清晰度远超 1080P 超分效果。在 Codepilot 宣传片测试中，材质质感也明显更好。这一改进解决了以往 AI 视频文字模糊的问题。

AI模型 Seedance 2.0 Codepilot 4K 视频生成文字渲染

推荐理由：Seedance 2.0 直接跑 4K，文字和材质细节比超分强太多，做视频宣传片很实用。

原文

22:45

Runway ML@runwayml

Runway 在 API 中推出了 Localize ads Recipe，支持通过单一 API 调用翻译静态广告和图形资产。用户只需输入一张广告图像，即可获得任意语言版本的输出。该功能旨在简化多市场广告素材的本地化流程，无需手动重新设计。目前该功能已可通过 Runway API 使用。

AI产品 Runway API 广告本地化多语言翻译

推荐理由：Runway 新出的本地化广告功能，一张图像丢进去，API 直接吐出多语言版本，省去挨个翻译的麻烦。

原文

21:54

AK@_akhaliq

hf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型，包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围，用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。

AI产品 hf-claude Claude Code GLM 5.2 MiniMax-M3 开源模型

推荐理由：想在 Claude Code 里用别的模型？hf-claude 能直接集成 100+ 开源模型，包括 GLM 5.2 和 DeepSeek v4 Pro，很方便。

原文

21:24

AI产品黄叔@PMbackttfuture

flomo Agent通过减少记录前0.5秒的摩擦，让普通人更容易坚持记录。它并非简单AI化，而是回归笔记核心。作者认为其真正对手不是Notion或Obsidian，而是微信文件传输助手。DeepSeek V4和王登科推动了产品进展，Agent功能虽少但更可信。flomo Agent结合Codex/Hermes可形成“记忆-行动”双系统。

AI产品 flomo Agent 微信文件传输助手 DeepSeek V4 智能体

推荐理由：flomo产品经理分享Agent真实使用体验，讲清它为什么不是跟Notion打架，而是跟微信文件传输助手抢用户。

原文

21:13

LMSYS Org (SGLang)@lmsysorg

71°

SGLang团队为DeepEP MoE引入两种调度时负载均衡器Waterfill和LPLB。Waterfill将共享专家工作分配到较轻的rank，在DeepSeek V3/R1上带来+1.48%到+4.66%的性能提升，V4 Flash吞吐量从49,253 tok/s增至51,677 tok/s。LPLB优化冗余路由专家副本的流量分配，在red16/red32配置下取得+0.84%到+7.34%的提升。两种方法均不改变模型语义，保持推理精度。

AI产品 SGLang DeepEP DeepSeek V3 推理优化负载均衡

推荐理由：SGLang给DeepSeek模型加了两个新负载均衡器，跑DeepSeek V3/R1速度能快最多7%，而且不改精度，想加速推理的可以试试。

原文

21:12

LMSYS Org (SGLang)@lmsysorg

精选

英伟达与智谱AI合作，发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构（40B活跃参数），专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现，在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器，实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。

AI模型 GLM-5.2 NVFP4 NVIDIA SGLang 推理模型

推荐理由：英伟达把GLM-5.2压缩成NVFP4，内存省一大截，推理编码在Blackwell上直接跑，SGLang第一时间就能用。

原文

21:12

LMSYS Org (SGLang)@lmsysorg

精选

Liquid AI 发布了 LFM2.5-230M 模型，参数规模仅 230M，是其最小模型。该模型基于 LFM2 架构，专为设备端部署设计，推理速度极快。它可在云端 GPU 和低成本 CPU 上运行，并支持工具调用和结构化数据提取。性能超过两倍参数量的模型，且已获 SGLang 的 Day 0 支持。

AI模型 LFM2.5-230M Liquid AI SGLang 推理模型设备端部署

推荐理由：Liquid AI 新出的 230M 小模型，跑得飞快，还能干工具调用的活，比两倍大的模型还强。

原文

19:24

idoubi@idoubicc

idoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课，5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示，以及从 idea 到上线的全流程拆解。费用 ¥4096/人次，赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。

技巧 ShipAny FastClaw Claude Code Codex 编程助手

推荐理由：idoubi 搞了个咖啡馆里的小桌课，一天时间教你用 Claude Code 和 Codex 落地 Agent 产品，还包学会 ShipAny 上站，广州朋友别错过。

原文

19:24

Tw93@HiTw93

Waza 已有 6k+ 用户，它将工程习惯转化为 AI 代理可运行的短命令（如 think、ui、check、hunt、write、learn、read、health）。针对 Claude Code 自带的 /design 命令，Waza 将自身对应命令调整为 /ui。此外，Waza 的技能模块现在支持自动检查更新。项目托管于 github.com/tw93/waza。

AI产品 Waza Claude Code 命令工具自动化

推荐理由：6k 多人在用 Waza，把常用操作变成 AI 能跑的短命令。它现在适配了 Claude Code 的 /design，改成 /ui 更顺手，技能还能自动更新，省心。

原文

17:24

idoubi@idoubicc

Expert Orchestration Agent 产品封装了半导体分析师 Peter（aleabitoreddit）的 serenity-skill，其分析框架基于 5,892 条推文和 4 篇长文蒸馏而成。agent runtime 采用前 WXG 高级工程师 idoubicc 的 FastClaw，与 OpenClaw 相比使用了更稳定的云原生架构设计。该产品旨在将专业分析师的经验转化为可复用的工具。

AI产品 Expert Orchestration Agent FastClaw OpenClaw 半导体分析智能体

推荐理由：这个工具把半导体分析师 Peter 的几千条推文和分析文章做成了可复用的 Agent，底层用 FastClaw 云原生架构，比 OpenClaw 更稳，适合做行业分析。

原文

16:54

向阳乔木@vista8

用户vista8分享了安装@wey_gu开发的nowledge mem应用，并配置MCP（Model Context Protocol）的体验。该应用支持AI对话记忆功能，同时集成个人知识库，提升AI交互的连续性。评论区提供下载链接，目前已有852次浏览和2次互动。

技巧 nowledge mem MCP AI对话记忆个人知识库

推荐理由：想给AI加上长期记忆？试试这个nowledge mem配MCP，能记对话还能建个人知识库，实用又简单。

原文

15:24

Marc Andreessen@pmarca

Joshua Achiam指出FLOP计算阈值作为AI监管标准一直存在根本缺陷，因为FLOP与模型能力（尤其是危险能力）并不直接相关，且前沿模型所需FLOP因算法进步而逐步降低。他批评欧盟AI法案（1047）等政策忽略了这些已知问题，导致政策制定混乱。Achiam认为AI安全社区将混乱归咎于Marc Andreessen等外部批评者是不公正的，社区自身存在战略失误。他强调更合理的政策应基于具体能力风险（如网络攻击）而非算力阈值。

行业 Joshua Achiam Marc Andreessen FLOP阈值 AI安全政策 1047法案

推荐理由：Joshua Achiam用亲身经历解释为什么FLOP门槛管不住AI风险，政策争论背后的真实问题是什么

原文

14:24

Marc Andreessen@pmarca

匿名AI研究员FleetingBits剖析了中国AI实验室格局：Zhipu类似Palantir，通过国企合同获得国家支持，其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo，多数收入来自海外（含美国）。字节跳动的Doubao是中国最流行的AI应用，但不开源模型。

行业 Zhipu GLM 5.2 MiniMax ByteDance Doubao AI生态

推荐理由：别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子，MiniMax用Talky和Hailuo出海赚美国人钱，字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。

原文

14:15

宝玉@dotey

76°

Anthropic 的 Mythos 5 模型在 6 月 12 日被美国政府全面封禁两周后，于今天获得部分解禁。商务部长 Howard Lutnick 致信 Anthropic，批准约 100 家美国政府机构和关键基础设施企业重新使用 Mythos 5。该模型与面向公众的 Fable 5 为同一底层模型，但 Mythos 5 去除了安全护栏，专门用于网络安全防御。封禁起因是 Amazon CEO 通过电话报告了 Fable 5 的安全越狱方法，导致全面下线。新指令允许这些机构的非美国籍员工以及 Anthropic 的非美国籍员工使用，比最初指令更灵活。

行业 Mythos 5 Anthropic Fable 5 AI安全监管

推荐理由：Anthropic 的 Mythos 5 因为太危险被禁，现在又因为太有用被请回来，还破例让非美国员工也能用，这剧情比电影还精彩。

原文

13:54

vLLM@vllm_project

精选

NVIDIA发布GLM-5.2的NVFP4检查点，在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行：vllm serve nvidia/GLM-5.2-NVFP4。

AI模型 GLM-5.2 NVFP4 vLLM NVIDIA 推理模型

推荐理由：想省显存又不想降精度？GLM-5.2的NVFP4版在vLLM上线了，比FP8省一半内存，推理编码长文本都稳。

原文

13:28

lmarena.ai@lmarena_ai

精选

Agent Arena通过代码编写、幻灯片制作等真实任务评估模型性能。Opus 4.8 Thinking每会话消耗较少token，质量提升+9.2%；Fable达到+14.1%的最高质量。GPT-5.5系列模型（+6.2%至+8.6%）以更少token超越前沿。Gemini-3.5 Flash消耗token最多但效果不佳，Grok Build 0.1消耗20K+ token却出现负提升。

AI模型 Agent Arena Opus Fable GPT-5.5 推理模型

推荐理由：想找token性价比高的模型？Agent Arena告诉你Opus和Fable有多能打，GPT-5.5也很省token。

原文

13:26

Lenny Rachitsky@lennysan

Anthropic工程师在2021年至2025年期间代码产出提升了8倍，编码被视为基本解决。产品团队当前最大的未解决问题是验证——如何确保构建的体验符合预期。这一观点来自Lenny Rachitsky与Anthropic旗下Claude Code/Cowork团队经理Fiona Fung的对话。Fung曾在Microsoft领导Visual Studio和TypeScript，在Meta参与VR/AR眼镜和Facebook Marketplace（年GMV超1000亿美元）。访谈还讨论了工程师的上下文切换、孤独感以及AI将影响哪些角色。

行业 Anthropic Claude Code 编码效率验证 Fiona Fung

推荐理由：Anthropic工程师写代码效率翻了8倍。但编码问题解决了，验证又成了新痛点。来听听Claude Code团队经理怎么说。

原文

13:26

lmarena.ai@lmarena_ai

Agent Arena的因果追踪方法论博客已发布。该方法论用于分析智能体在Agent Arena中的因果链。读者可通过博客深入了解Agent Arena的评估设计。

论文 Agent Arena 因果追踪智能体

推荐理由：想搞懂Agent Arena怎么分析智能体因果链的？这篇博客讲得明明白白。

原文

13:25

Philipp Schmid@_philschmid

精选

Interactions API 引入了 background=True 参数，用于处理超过标准 HTTP 超时限制的长时间运行异步代理任务。官方发布使用指南，说明如何配置请求、在任务完成后重新连接以及流式传输结果。该参数允许客户端在提交任务后立即返回，而无需保持连接直到任务完成。

技巧 Interactions API background=True 异步任务教程

推荐理由：写异步 agent 任务总超时？试试 Interactions API 新加的 background=True，可以断开等结果再重连，还支持流式。

原文

13:23

Jerry Liu@jerryjliu0

精选

LlamaParse现已成为n8n的官方验证社区节点，提供Parse、Extract、Classify、Split、Retrieve五大核心功能。用户可在n8n工作流中构建文档提取流程（如贷款处理）或索引文档知识库并接入AI Agent。该节点支持将每个资源作为可调用工具，让AI Agent自主决定何时检索上下文、解析文件或提取结构化数据。

AI产品 LlamaParse n8n LlamaIndex 文档解析智能体

推荐理由：LlamaIndex的文档解析工具正式入驻n8n，能处理复杂文档的提取、分类和检索，还能让AI Agent自主调用，搭建工作流超方便。

原文

13:22

Gary Marcus@GaryMarcus

David Shor的观察指出，选民对AI导致的就业替代问题态度出奇一致地左倾。他提到，对企业征税来资助相关项目通常是争议性话题，但在AI失业问题上两党存在广泛共识。这表明美国政治在AI转型初期已形成某种政策共识。

行业 AI就业替代政策民意税收补贴

推荐理由：这个民意发现挺有意思：左右两派在AI失业问题上居然都支持征税补贴，对理解未来AI政策走向很有参考价值。

原文

13:21

LangChain@LangChainAI

LangChain与Chime合作发布指南，指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用，强调可观测性、合规性和风险控制。指南提供具体步骤，帮助团队实现更可靠的AI部署。

技巧 LangChain Chime 智能体 AI安全

推荐理由：LangChain出了个新指南，专门讲金融服务怎么搞生产级智能体，还加了更强监督。做金融AI的可以看看，省了自己踩坑。

原文

13:21

Mustafa Suleyman@mustafasuleyman

Mustafa Suleyman在推文中详细阐述了微软AI团队的核心文化原则，包括科学严谨性优先、保持精简团队、数据无黑箱、自己使用自家模型等9条准则。他强调基于假设验证和数据驱动决策，反对过早庆祝结果，并要求所有成员对自己的数据负责。这些原则旨在通过纪律性和证据导向的方法论来加速模型迭代。

行业 Microsoft AI Mustafa Suleyman AI文化团队管理

推荐理由：微软AI负责人亲自写的团队工作准则，全是干货——怎么避免数据作弊、怎么做消融实验，做AI的都可以参考。

原文

13:20

LangChain@LangChainAI

Alex Olsen 加入 LangChain 团队后发表首篇文章，详解 Deep Agents 如何利用 prompt caching 技术减少 API 调用次数。该方案通过缓存重复提示词，最高可降低 50% 的 API 成本。文章提供了具体实现步骤和代码示例，帮助开发者快速集成。

技巧 LangChain Deep Agents prompt caching 成本优化

推荐理由：LangChain 新成员 Alex 手把手教你给 Deep Agents 加缓存，省下一半 API 钱，实用技巧别错过。

原文

13:17

HeyGen@HeyGen_Official

HeyGen发布了新一代HyperFrames技能，包含9种可自动路由的视频工作流。智能体能够从上下文理解用户意图，自动匹配到启动视频、音乐视频、字幕和叠加等任务。用户无需手动切换，直接输入指令即可触发对应功能。该更新显著提升了AI视频制作的自动化程度。

AI产品 HeyGen HyperFrames 视频生成智能体

推荐理由：HeyGen的HyperFrames升级后，智能体能听懂你让它做哪种视频，直接开搞，不用自己选模板了，省事多了。

原文

13:16

a16z@a16z

行业 a16z AI原生初创公司员工规模行业趋势

推荐理由：a16z用数据告诉你，AI初创公司为什么人少效率高。看看AI怎么帮团队瘦身。

原文

13:14

OpenRouter@OpenRouterAI

推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会（Model Council），并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证，确认效果出色。示例提供了可操作的步骤，帮助开发者利用多个模型协作解决问题。

技巧 OpenRouter MCP 模型委员会智能体提示词工程

推荐理由：OpenRouter官方示范，手把手教你用MCP搭模型委员会，实测好用。

原文

13:13

elvis@omarsar0

84°

OpenAI 宣布了 GPT-5.6 系列，包括前沿模型 Sol、均衡模型 Terra 以及快速廉价模型 Luna。目前仅提供有限预览，少数用户可访问。评论者担忧这种策略不利于行业，呼吁开源AI取胜。

AI模型 GPT-5.6 OpenAI Sol Terra Luna 开源模型

推荐理由：OpenAI 刚出了三个 GPT-5.6 模型，有强有快有便宜，但只给少数人用，引起争议。

原文

13:06

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名，比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2，HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。

AI模型 GLM-5.2 Code Arena Claude Opus 4.8 开源模型编程助手

推荐理由：GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus，你可以在前端任务中试试它的单次生成效果。

原文

13:04

orange.ai@oran_ge

oran_ge基于Cola的token消耗统计发现，GLM 5.2正在取代Claude Sonnet和Opus，成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型，而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户（GPT 5.5受众）画像是完全不同的。

行业 GLM 5.2 DeepSeek v4 Pro GPT 5.5 模型趋势用户偏好

推荐理由：oran_ge用Cola数据发现一个反常识现象：GLM 5.2在抢Claude的付费用户，而GPT 5.5却没人用，值得看看

原文

13:01

LangChain@LangChainAI

精选

SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察：在真实对话中，决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话，模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。

行业 LangChain SierraPlatform 语音代理智能体

推荐理由：Sierra的语音代理模仿人类并行处理对话，不是简单轮流说话，值得做语音产品的朋友看看。

原文

12:57

OpenRouter@OpenRouterAI

精选

OpenRouter发布了一个MCP演示，展示agent如何通过MCP从DesignArena拉取实时设计模型排行。演示中，agent同时启动GLM-5.2、Opus 4.7和Kimi 2.6三个子模型，各自生成自画像网页并排展示。用户可以直接对比三个模型的输出，选择最喜欢的设计。这种方式省去了手动注册多个平台、重复输入提示词的繁琐流程。

技巧 OpenRouter MCP/工具 GLM-5.2 Opus 4.7 Kimi 2.6

推荐理由：OpenRouter演示了怎么用MCP让agent自动调用GLM-5.2、Opus 4.7、Kimi 2.6三个模型并排出设计图，再也不用一个个手动试了。

原文

12:56

Epoch AI@EpochAIResearch

精选

Epoch AI 推出了 MirrorCode，一个长周期软件工程基准，允许 AI 模型自主编程数天。最佳模型（如 GPT-4、Claude 3.5）在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务，每个任务需要多步代码修改和调试。结果显示，当前 AI 在处理持续数小时的工程任务时仍面临挑战，但进步显著。

AI模型 MirrorCode Epoch AI 编程助手基准测试推理模型

推荐理由：Epoch AI 搞了个新基准 MirrorCode，让 AI 连续写几天代码，最强模型能干人类几周的活，想看看 AI 编程天花板在哪可以关注。

原文

12:55

Cohere@cohere

88°

OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求，目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问，但需确保安全。

AI模型 OpenAI GPT-5.6 AI安全编程助手

推荐理由：OpenAI要发GPT-5.6了，有三个版本（Sol、Terra、Luna）。现在只有政府批准的合作伙伴能试，几周后全面开放。想尝鲜可以关注Codex和API的预览。

原文

12:53

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体评测基准开源模型实验室

推荐理由：想看看谁家的智能体最强？Agent Arena排行榜刚上线，可以按开源模型和实验室筛选，挺方便。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。