00:56berryxia@berryxia精选Anthropic应用AI负责人Lamis在2026年AI DevCon上分享了Agent记忆系统的四层架构。起点是CLAUDE.md文件,效果超过复杂Prompt工程。第二层是记忆工具,让Agent自主读写更新,判断力比人强。第三层Skills实现渐进式披露,类似从书架抽词典。第四层把记忆建模为文件系统,用bash/grep,无需向量数据库。还引入"做梦"(带外异步处理)分析跨会话模式,已在生产中提升任务效率并降低成本。技巧Claude Code记忆管理智能体Anthropic提示词工程10 个信源在谈推荐理由:Anthropic官方分享了他们怎么让Agent记住东西:从Markdown文件到做梦机制,很实用的四层方法论,看完可以少走弯路。原文
00:49Geek@geekbb73°DeepSeek 在 Pro Max 模式下于多个编码/工程基准取得领先成绩:LiveCodeBench 93.5%、Codeforces Rating 3206、SWE Verified 80.6%,超越 GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6 等闭源模型。这些结果来自 X 用户 @geekbb 的推文,并关联到 DeepSeek 的 Hugging Face 仓库。目前该模型尚未开放本地部署,引发社区期待。AI模型DeepSeekPro Max编码基准开源模型推荐理由:DeepSeek 拿 Pro Max 模式在 LiveCodeBench 等三大编码基准上直接碾压 GPT-5.4 和 Claude Opus 4.6,分数拉满,但还没开放下载,先来围观一下。原文
00:19elvis@omarsar0Eve 是一款专注于快速构建智能体的工具,主打直观和可定制。用户反馈其界面简单易用,无需复杂编程即可上手。经过一周实际使用,早期体验者认为它确实能稳定运行。AI产品Eve智能体工具No-Code推荐理由:想玩智能体又怕麻烦?试试Eve,特直观,随便拖拽就能搭起来,真心好用。原文
00:01MIT CSAIL@MIT_CSAIL一份由Anatoli Kopadze整理的18步Claude使用教程发布。教程涵盖从基础提示到高级工作流的技巧,共18个步骤。每个步骤针对Claude交互中的具体场景提供指导。用户可系统提升与Claude的协作效率。技巧ClaudeAnthropic提示词工程教程10 个信源在谈推荐理由:想用好Claude?这有18个实用步骤,从提示词到工作流全涵盖,练完你就是高手。原文
23:12歸藏(guizang.ai)@op7418精选Seedance 2.0 新增原生4K分辨率生成,文字清晰度显著提升。用户@op7418用 Codepilot 宣传片对比,4K 版文字边缘锐利,材质质感远超1080P超分结果。该版本展示了4K视频生成在文字渲染上的突破。AI产品Seedance 2.04K视频生成Codepilot文字清晰度推荐理由:Seedance 2.0 原生4K出片,文字清晰度实拍太猛了,比超分强一大截。原文
23:12歸藏(guizang.ai)@op7418Seedance 2.0 原生支持 4K 分辨率生成视频,文字清晰度远超 1080P 超分效果。在 Codepilot 宣传片测试中,材质质感也明显更好。这一改进解决了以往 AI 视频文字模糊的问题。AI模型Seedance 2.0Codepilot4K视频生成文字渲染推荐理由:Seedance 2.0 直接跑 4K,文字和材质细节比超分强太多,做视频宣传片很实用。原文
22:45Runway ML@runwaymlRunway 在 API 中推出了 Localize ads Recipe,支持通过单一 API 调用翻译静态广告和图形资产。用户只需输入一张广告图像,即可获得任意语言版本的输出。该功能旨在简化多市场广告素材的本地化流程,无需手动重新设计。目前该功能已可通过 Runway API 使用。AI产品RunwayAPI广告本地化多语言翻译推荐理由:Runway 新出的本地化广告功能,一张图像丢进去,API 直接吐出多语言版本,省去挨个翻译的麻烦。原文
21:54AK@_akhaliqhf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型,包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围,用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。AI产品hf-claudeClaude CodeGLM 5.2MiniMax-M3开源模型4 个信源在谈推荐理由:想在 Claude Code 里用别的模型?hf-claude 能直接集成 100+ 开源模型,包括 GLM 5.2 和 DeepSeek v4 Pro,很方便。原文
21:24AI产品黄叔@PMbackttfutureflomo Agent通过减少记录前0.5秒的摩擦,让普通人更容易坚持记录。它并非简单AI化,而是回归笔记核心。作者认为其真正对手不是Notion或Obsidian,而是微信文件传输助手。DeepSeek V4和王登科推动了产品进展,Agent功能虽少但更可信。flomo Agent结合Codex/Hermes可形成“记忆-行动”双系统。AI产品flomoAgent微信文件传输助手DeepSeek V4智能体3 个信源在谈推荐理由:flomo产品经理分享Agent真实使用体验,讲清它为什么不是跟Notion打架,而是跟微信文件传输助手抢用户。原文
21:13LMSYS Org (SGLang)@lmsysorg71°SGLang团队为DeepEP MoE引入两种调度时负载均衡器Waterfill和LPLB。Waterfill将共享专家工作分配到较轻的rank,在DeepSeek V3/R1上带来+1.48%到+4.66%的性能提升,V4 Flash吞吐量从49,253 tok/s增至51,677 tok/s。LPLB优化冗余路由专家副本的流量分配,在red16/red32配置下取得+0.84%到+7.34%的提升。两种方法均不改变模型语义,保持推理精度。AI产品SGLangDeepEPDeepSeek V3推理优化负载均衡推荐理由:SGLang给DeepSeek模型加了两个新负载均衡器,跑DeepSeek V3/R1速度能快最多7%,而且不改精度,想加速推理的可以试试。原文
21:12LMSYS Org (SGLang)@lmsysorg精选英伟达与智谱AI合作,发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构(40B活跃参数),专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现,在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器,实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。AI模型GLM-5.2NVFP4NVIDIASGLang推理模型5 个信源在谈推荐理由:英伟达把GLM-5.2压缩成NVFP4,内存省一大截,推理编码在Blackwell上直接跑,SGLang第一时间就能用。原文
21:12LMSYS Org (SGLang)@lmsysorg精选Liquid AI 发布了 LFM2.5-230M 模型,参数规模仅 230M,是其最小模型。该模型基于 LFM2 架构,专为设备端部署设计,推理速度极快。它可在云端 GPU 和低成本 CPU 上运行,并支持工具调用和结构化数据提取。性能超过两倍参数量的模型,且已获 SGLang 的 Day 0 支持。AI模型LFM2.5-230MLiquid AISGLang推理模型设备端部署推荐理由:Liquid AI 新出的 230M 小模型,跑得飞快,还能干工具调用的活,比两倍大的模型还强。原文
19:24idoubi@idoubiccidoubicc 在广州南沙客运港举办了 codefree.cafe 第一期 AI 编程小桌课,5 位学员在 6 小时结对编程中用 ShipAny 和 FastClaw 构建了 Agent 产品。课程涵盖 Claude Code 和 Codex 的网络配置、Vibe Coding 技巧、ShipAny 快速上站演示,以及从 idea 到上线的全流程拆解。费用 ¥4096/人次,赠送价值 ¥3072 的 ShipAny 会员、1024 社群会员和《这就是 MCP》一书。技巧ShipAnyFastClawClaude CodeCodex编程助手推荐理由:idoubi 搞了个咖啡馆里的小桌课,一天时间教你用 Claude Code 和 Codex 落地 Agent 产品,还包学会 ShipAny 上站,广州朋友别错过。原文
19:24Tw93@HiTw93Waza 已有 6k+ 用户,它将工程习惯转化为 AI 代理可运行的短命令(如 think、ui、check、hunt、write、learn、read、health)。针对 Claude Code 自带的 /design 命令,Waza 将自身对应命令调整为 /ui。此外,Waza 的技能模块现在支持自动检查更新。项目托管于 github.com/tw93/waza。AI产品WazaClaude Code命令工具自动化推荐理由:6k 多人在用 Waza,把常用操作变成 AI 能跑的短命令。它现在适配了 Claude Code 的 /design,改成 /ui 更顺手,技能还能自动更新,省心。原文
17:24idoubi@idoubiccExpert Orchestration Agent 产品封装了半导体分析师 Peter(aleabitoreddit)的 serenity-skill,其分析框架基于 5,892 条推文和 4 篇长文蒸馏而成。agent runtime 采用前 WXG 高级工程师 idoubicc 的 FastClaw,与 OpenClaw 相比使用了更稳定的云原生架构设计。该产品旨在将专业分析师的经验转化为可复用的工具。AI产品Expert Orchestration AgentFastClawOpenClaw半导体分析智能体4 个信源在谈推荐理由:这个工具把半导体分析师 Peter 的几千条推文和分析文章做成了可复用的 Agent,底层用 FastClaw 云原生架构,比 OpenClaw 更稳,适合做行业分析。原文
16:54向阳乔木@vista8用户vista8分享了安装@wey_gu开发的nowledge mem应用,并配置MCP(Model Context Protocol)的体验。该应用支持AI对话记忆功能,同时集成个人知识库,提升AI交互的连续性。评论区提供下载链接,目前已有852次浏览和2次互动。技巧nowledge memMCPAI对话记忆个人知识库推荐理由:想给AI加上长期记忆?试试这个nowledge mem配MCP,能记对话还能建个人知识库,实用又简单。原文
15:24Marc Andreessen@pmarcaJoshua Achiam指出FLOP计算阈值作为AI监管标准一直存在根本缺陷,因为FLOP与模型能力(尤其是危险能力)并不直接相关,且前沿模型所需FLOP因算法进步而逐步降低。他批评欧盟AI法案(1047)等政策忽略了这些已知问题,导致政策制定混乱。Achiam认为AI安全社区将混乱归咎于Marc Andreessen等外部批评者是不公正的,社区自身存在战略失误。他强调更合理的政策应基于具体能力风险(如网络攻击)而非算力阈值。行业Joshua AchiamMarc AndreessenFLOP阈值AI安全政策1047法案推荐理由:Joshua Achiam用亲身经历解释为什么FLOP门槛管不住AI风险,政策争论背后的真实问题是什么原文
14:24Marc Andreessen@pmarca匿名AI研究员FleetingBits剖析了中国AI实验室格局:Zhipu类似Palantir,通过国企合同获得国家支持,其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo,多数收入来自海外(含美国)。字节跳动的Doubao是中国最流行的AI应用,但不开源模型。行业ZhipuGLM 5.2MiniMaxByteDanceDoubaoAI生态2 个信源在谈推荐理由:别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子,MiniMax用Talky和Hailuo出海赚美国人钱,字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。原文
14:15宝玉@dotey76°Anthropic 的 Mythos 5 模型在 6 月 12 日被美国政府全面封禁两周后,于今天获得部分解禁。商务部长 Howard Lutnick 致信 Anthropic,批准约 100 家美国政府机构和关键基础设施企业重新使用 Mythos 5。该模型与面向公众的 Fable 5 为同一底层模型,但 Mythos 5 去除了安全护栏,专门用于网络安全防御。封禁起因是 Amazon CEO 通过电话报告了 Fable 5 的安全越狱方法,导致全面下线。新指令允许这些机构的非美国籍员工以及 Anthropic 的非美国籍员工使用,比最初指令更灵活。行业Mythos 5AnthropicFable 5AI安全监管10 个信源在谈推荐理由:Anthropic 的 Mythos 5 因为太危险被禁,现在又因为太有用被请回来,还破例让非美国员工也能用,这剧情比电影还精彩。原文
13:54vLLM@vllm_project精选NVIDIA发布GLM-5.2的NVFP4检查点,在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行:vllm serve nvidia/GLM-5.2-NVFP4。AI模型GLM-5.2NVFP4vLLMNVIDIA推理模型4 个信源在谈推荐理由:想省显存又不想降精度?GLM-5.2的NVFP4版在vLLM上线了,比FP8省一半内存,推理编码长文本都稳。原文
13:28lmarena.ai@lmarena_ai精选Agent Arena通过代码编写、幻灯片制作等真实任务评估模型性能。Opus 4.8 Thinking每会话消耗较少token,质量提升+9.2%;Fable达到+14.1%的最高质量。GPT-5.5系列模型(+6.2%至+8.6%)以更少token超越前沿。Gemini-3.5 Flash消耗token最多但效果不佳,Grok Build 0.1消耗20K+ token却出现负提升。AI模型Agent ArenaOpusFableGPT-5.5推理模型推荐理由:想找token性价比高的模型?Agent Arena告诉你Opus和Fable有多能打,GPT-5.5也很省token。原文
13:26Lenny Rachitsky@lennysanAnthropic工程师在2021年至2025年期间代码产出提升了8倍,编码被视为基本解决。产品团队当前最大的未解决问题是验证——如何确保构建的体验符合预期。这一观点来自Lenny Rachitsky与Anthropic旗下Claude Code/Cowork团队经理Fiona Fung的对话。Fung曾在Microsoft领导Visual Studio和TypeScript,在Meta参与VR/AR眼镜和Facebook Marketplace(年GMV超1000亿美元)。访谈还讨论了工程师的上下文切换、孤独感以及AI将影响哪些角色。行业AnthropicClaude Code编码效率验证Fiona Fung10 个信源在谈推荐理由:Anthropic工程师写代码效率翻了8倍。但编码问题解决了,验证又成了新痛点。来听听Claude Code团队经理怎么说。原文
13:26lmarena.ai@lmarena_aiAgent Arena的因果追踪方法论博客已发布。该方法论用于分析智能体在Agent Arena中的因果链。读者可通过博客深入了解Agent Arena的评估设计。论文Agent Arena因果追踪智能体推荐理由:想搞懂Agent Arena怎么分析智能体因果链的?这篇博客讲得明明白白。原文
13:25Philipp Schmid@_philschmid精选Interactions API 引入了 background=True 参数,用于处理超过标准 HTTP 超时限制的长时间运行异步代理任务。官方发布使用指南,说明如何配置请求、在任务完成后重新连接以及流式传输结果。该参数允许客户端在提交任务后立即返回,而无需保持连接直到任务完成。技巧Interactions APIbackground=True异步任务教程推荐理由:写异步 agent 任务总超时?试试 Interactions API 新加的 background=True,可以断开等结果再重连,还支持流式。原文
13:23Jerry Liu@jerryjliu0精选LlamaParse现已成为n8n的官方验证社区节点,提供Parse、Extract、Classify、Split、Retrieve五大核心功能。用户可在n8n工作流中构建文档提取流程(如贷款处理)或索引文档知识库并接入AI Agent。该节点支持将每个资源作为可调用工具,让AI Agent自主决定何时检索上下文、解析文件或提取结构化数据。AI产品LlamaParsen8nLlamaIndex文档解析智能体推荐理由:LlamaIndex的文档解析工具正式入驻n8n,能处理复杂文档的提取、分类和检索,还能让AI Agent自主调用,搭建工作流超方便。原文
13:22Gary Marcus@GaryMarcusDavid Shor的观察指出,选民对AI导致的就业替代问题态度出奇一致地左倾。他提到,对企业征税来资助相关项目通常是争议性话题,但在AI失业问题上两党存在广泛共识。这表明美国政治在AI转型初期已形成某种政策共识。行业AI就业替代政策民意税收补贴推荐理由:这个民意发现挺有意思:左右两派在AI失业问题上居然都支持征税补贴,对理解未来AI政策走向很有参考价值。原文
13:21LangChain@LangChainAILangChain与Chime合作发布指南,指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用,强调可观测性、合规性和风险控制。指南提供具体步骤,帮助团队实现更可靠的AI部署。技巧LangChainChime智能体AI安全推荐理由:LangChain出了个新指南,专门讲金融服务怎么搞生产级智能体,还加了更强监督。做金融AI的可以看看,省了自己踩坑。原文
13:21Mustafa Suleyman@mustafasuleymanMustafa Suleyman在推文中详细阐述了微软AI团队的核心文化原则,包括科学严谨性优先、保持精简团队、数据无黑箱、自己使用自家模型等9条准则。他强调基于假设验证和数据驱动决策,反对过早庆祝结果,并要求所有成员对自己的数据负责。这些原则旨在通过纪律性和证据导向的方法论来加速模型迭代。行业Microsoft AIMustafa SuleymanAI文化团队管理推荐理由:微软AI负责人亲自写的团队工作准则,全是干货——怎么避免数据作弊、怎么做消融实验,做AI的都可以参考。原文
13:20LangChain@LangChainAIAlex Olsen 加入 LangChain 团队后发表首篇文章,详解 Deep Agents 如何利用 prompt caching 技术减少 API 调用次数。该方案通过缓存重复提示词,最高可降低 50% 的 API 成本。文章提供了具体实现步骤和代码示例,帮助开发者快速集成。技巧LangChainDeep Agentsprompt caching成本优化推荐理由:LangChain 新成员 Alex 手把手教你给 Deep Agents 加缓存,省下一半 API 钱,实用技巧别错过。原文
13:17HeyGen@HeyGen_OfficialHeyGen发布了新一代HyperFrames技能,包含9种可自动路由的视频工作流。智能体能够从上下文理解用户意图,自动匹配到启动视频、音乐视频、字幕和叠加等任务。用户无需手动切换,直接输入指令即可触发对应功能。该更新显著提升了AI视频制作的自动化程度。AI产品HeyGenHyperFrames视频生成智能体推荐理由:HeyGen的HyperFrames升级后,智能体能听懂你让它做哪种视频,直接开搞,不用自己选模板了,省事多了。原文
13:16a16z@a16za16z最新图表显示,AI原生初创公司平均员工数显著低于传统科技初创公司。其中,AI原生公司中位员工数为10人,而非AI初创公司中位数为25人。a16z分析了2023-2024年成立的3000多家初创公司数据。这一趋势反映了AI工具对团队效率的提升作用。行业a16zAI原生初创公司员工规模行业趋势推荐理由:a16z用数据告诉你,AI初创公司为什么人少效率高。看看AI怎么帮团队瘦身。原文
13:14OpenRouter@OpenRouterAI推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会(Model Council),并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证,确认效果出色。示例提供了可操作的步骤,帮助开发者利用多个模型协作解决问题。技巧OpenRouterMCP模型委员会智能体提示词工程推荐理由:OpenRouter官方示范,手把手教你用MCP搭模型委员会,实测好用。原文
13:13elvis@omarsar084°OpenAI 宣布了 GPT-5.6 系列,包括前沿模型 Sol、均衡模型 Terra 以及快速廉价模型 Luna。目前仅提供有限预览,少数用户可访问。评论者担忧这种策略不利于行业,呼吁开源AI取胜。AI模型GPT-5.6OpenAISolTerraLuna开源模型10 个信源在谈推荐理由:OpenAI 刚出了三个 GPT-5.6 模型,有强有快有便宜,但只给少数人用,引起争议。原文
13:06lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名,比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2,HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。AI模型GLM-5.2Code ArenaClaude Opus 4.8开源模型编程助手2 个信源在谈推荐理由:GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus,你可以在前端任务中试试它的单次生成效果。原文
13:04orange.ai@oran_georan_ge基于Cola的token消耗统计发现,GLM 5.2正在取代Claude Sonnet和Opus,成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型,而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户(GPT 5.5受众)画像是完全不同的。行业GLM 5.2DeepSeek v4 ProGPT 5.5模型趋势用户偏好1 个信源在谈推荐理由:oran_ge用Cola数据发现一个反常识现象:GLM 5.2在抢Claude的付费用户,而GPT 5.5却没人用,值得看看原文
13:01LangChain@LangChainAI精选SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察:在真实对话中,决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话,模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。行业LangChainSierraPlatform语音代理智能体推荐理由:Sierra的语音代理模仿人类并行处理对话,不是简单轮流说话,值得做语音产品的朋友看看。原文
12:57OpenRouter@OpenRouterAI精选OpenRouter发布了一个MCP演示,展示agent如何通过MCP从DesignArena拉取实时设计模型排行。演示中,agent同时启动GLM-5.2、Opus 4.7和Kimi 2.6三个子模型,各自生成自画像网页并排展示。用户可以直接对比三个模型的输出,选择最喜欢的设计。这种方式省去了手动注册多个平台、重复输入提示词的繁琐流程。技巧OpenRouterMCP/工具GLM-5.2Opus 4.7Kimi 2.6推荐理由:OpenRouter演示了怎么用MCP让agent自动调用GLM-5.2、Opus 4.7、Kimi 2.6三个模型并排出设计图,再也不用一个个手动试了。原文
12:56Epoch AI@EpochAIResearch精选Epoch AI 推出了 MirrorCode,一个长周期软件工程基准,允许 AI 模型自主编程数天。最佳模型(如 GPT-4、Claude 3.5)在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务,每个任务需要多步代码修改和调试。结果显示,当前 AI 在处理持续数小时的工程任务时仍面临挑战,但进步显著。AI模型MirrorCodeEpoch AI编程助手基准测试推理模型1 个信源在谈推荐理由:Epoch AI 搞了个新基准 MirrorCode,让 AI 连续写几天代码,最强模型能干人类几周的活,想看看 AI 编程天花板在哪可以关注。原文
12:55Cohere@cohere88°OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求,目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问,但需确保安全。AI模型OpenAIGPT-5.6AI安全编程助手10 个信源在谈推荐理由:OpenAI要发GPT-5.6了,有三个版本(Sol、Terra、Luna)。现在只有政府批准的合作伙伴能试,几周后全面开放。想尝鲜可以关注Codex和API的预览。原文
12:53lmarena.ai@lmarena_aiAgent Arena排行榜已正式上线,用户可通过链接访问页面查看详情。排行榜支持按开放模型或实验室(lab)进行筛选过滤。目前该页面已有400次浏览,由xgo.ing提供技术支持。AI模型Agent Arena智能体评测基准开源模型实验室推荐理由:想看看谁家的智能体最强?Agent Arena排行榜刚上线,可以按开源模型和实验室筛选,挺方便。原文