15:30IT之家(博客/媒体)72°高通计划将数据中心的高带宽计算架构引入手机SoC,该架构通过垂直堆叠芯片让内存与计算芯片物理距离缩短。第一代产品预计2025年在数据中心推出,2028年投入商用。移动设备引入后,用户可在本地运行更多AI模型并全天使用AI智能体,且对耗电量影响不大。AI产品高通垂直堆叠端侧AI智能体芯片架构推荐理由:高通要把数据中心的黑科技搬到手机上,以后手机本地跑AI更流畅还不费电,值得关注。原文
15:24Marc Andreessen@pmarcaJoshua Achiam指出FLOP计算阈值作为AI监管标准一直存在根本缺陷,因为FLOP与模型能力(尤其是危险能力)并不直接相关,且前沿模型所需FLOP因算法进步而逐步降低。他批评欧盟AI法案(1047)等政策忽略了这些已知问题,导致政策制定混乱。Achiam认为AI安全社区将混乱归咎于Marc Andreessen等外部批评者是不公正的,社区自身存在战略失误。他强调更合理的政策应基于具体能力风险(如网络攻击)而非算力阈值。行业Joshua AchiamMarc AndreessenFLOP阈值AI安全政策1047法案推荐理由:Joshua Achiam用亲身经历解释为什么FLOP门槛管不住AI风险,政策争论背后的真实问题是什么原文
15:06Latent Space (swyx)@Latent.Space82°OpenAI 发布了 GPT-5.6 的三个变体:Sol、Terra 和 Luna。这些模型目前仅限可信合作伙伴访问。同一天,OpenAI 和 Anthropic 都进行了分层次发布。AI模型GPT-5.6OpenAISolTerraLuna10 个信源在谈推荐理由:OpenAI 偷偷发了 GPT-5.6 三个版本,只给合作伙伴,可能性能有差,关注后续。原文
14:24Marc Andreessen@pmarca匿名AI研究员FleetingBits剖析了中国AI实验室格局:Zhipu类似Palantir,通过国企合同获得国家支持,其GLM 5.2模型毛利率约40%。MiniMax主打陪伴App Talky和视频生成App Hailuo,多数收入来自海外(含美国)。字节跳动的Doubao是中国最流行的AI应用,但不开源模型。行业ZhipuGLM 5.2MiniMaxByteDanceDoubaoAI生态2 个信源在谈推荐理由:别只盯着DeepSeek了。Zhipu毛利率40%靠国企单子,MiniMax用Talky和Hailuo出海赚美国人钱,字节Doubao闷声发大财——这篇把中国AI家底都抖出来了。原文
14:15宝玉@dotey76°Anthropic 的 Mythos 5 模型在 6 月 12 日被美国政府全面封禁两周后,于今天获得部分解禁。商务部长 Howard Lutnick 致信 Anthropic,批准约 100 家美国政府机构和关键基础设施企业重新使用 Mythos 5。该模型与面向公众的 Fable 5 为同一底层模型,但 Mythos 5 去除了安全护栏,专门用于网络安全防御。封禁起因是 Amazon CEO 通过电话报告了 Fable 5 的安全越狱方法,导致全面下线。新指令允许这些机构的非美国籍员工以及 Anthropic 的非美国籍员工使用,比最初指令更灵活。行业Mythos 5AnthropicFable 5AI安全监管10 个信源在谈推荐理由:Anthropic 的 Mythos 5 因为太危险被禁,现在又因为太有用被请回来,还破例让非美国员工也能用,这剧情比电影还精彩。原文
14:09IT之家(博客/媒体)韩国政府于6月27日成立跨部门协商机构,应对深度伪造性剥削犯罪、AI伪造声音诈骗等涉AI犯罪行为。该机构由科学技术信息通信部、外交部、法务部、警察厅等组成。韩国广播通信委员会指出,AI犯罪跨越网络、电信、金融等多个领域,单一部门难以应对,需要加强跨部门协调合作。行业韩国政府深度伪造金融诈骗AI安全监管推荐理由:韩国政府动手了,专门成立跨部门机构打击AI犯罪,包括深度伪造性剥削、AI诈骗等,行动力很强。原文
13:57IT之家(博客/媒体)精选美满电子于6月24日发布Structera X和Structera A两款CXL控制器,配备CDB压缩-解压模块。该模块使用定制版LZ4无损压缩算法,对全零页面最高压缩比64:1。在Database (nci)数据类型测试中,压缩比达3.64x。Structera X支持超过6TB DDR5内存,Structera A集成16个Arm Neoverse V2核心。这是业内首批将硬件内联内存压缩写入OCP规格的产品。AI产品MarvellStructeraCXL内联压缩LZ4推荐理由:Marvell新出的Structera CXL控制器用硬件压缩把内存压了3.6倍,AI服务器内存不够用的问题有救了,比软件压缩快还不占CPU。原文
13:54vLLM@vllm_project精选NVIDIA发布GLM-5.2的NVFP4检查点,在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行:vllm serve nvidia/GLM-5.2-NVFP4。AI模型GLM-5.2NVFP4vLLMNVIDIA推理模型4 个信源在谈推荐理由:想省显存又不想降精度?GLM-5.2的NVFP4版在vLLM上线了,比FP8省一半内存,推理编码长文本都稳。原文
13:54量子位@一水微软发布年度AI职场报告,共28页。报告将员工AI准备度评为Advanced,企业评为Beginner。调研数据显示员工在AI工具使用上领先于企业,而多数公司缺乏正式策略。报告呼吁企业加速部署AI基础设施与培训。行业微软AI职场报告Work Trend Index企业AI部署员工采纳推荐理由:微软新报告说员工早都用上AI了,公司却还在拖后腿。28页干货,看看差距有多大。原文
13:28lmarena.ai@lmarena_ai精选Agent Arena通过代码编写、幻灯片制作等真实任务评估模型性能。Opus 4.8 Thinking每会话消耗较少token,质量提升+9.2%;Fable达到+14.1%的最高质量。GPT-5.5系列模型(+6.2%至+8.6%)以更少token超越前沿。Gemini-3.5 Flash消耗token最多但效果不佳,Grok Build 0.1消耗20K+ token却出现负提升。AI模型Agent ArenaOpusFableGPT-5.5推理模型推荐理由:想找token性价比高的模型?Agent Arena告诉你Opus和Fable有多能打,GPT-5.5也很省token。原文
13:27量子位@智能车参考深度机智在两个月内连续完成两轮数亿元融资,投资方包括知名产业资本。资金将用于全栈自主可控的物理AI基座模型研发,该模型可赋能机器人、自动驾驶等场景。国产物理AI基础模型领域迎来重要资本注入。行业深度机智物理AI融资国产基础模型推荐理由:这家公司两个月融了两轮数亿元,专做物理AI基座模型,国内做这个的还不多,值得关注。原文
13:26Lenny Rachitsky@lennysanAnthropic工程师在2021年至2025年期间代码产出提升了8倍,编码被视为基本解决。产品团队当前最大的未解决问题是验证——如何确保构建的体验符合预期。这一观点来自Lenny Rachitsky与Anthropic旗下Claude Code/Cowork团队经理Fiona Fung的对话。Fung曾在Microsoft领导Visual Studio和TypeScript,在Meta参与VR/AR眼镜和Facebook Marketplace(年GMV超1000亿美元)。访谈还讨论了工程师的上下文切换、孤独感以及AI将影响哪些角色。行业AnthropicClaude Code编码效率验证Fiona Fung10 个信源在谈推荐理由:Anthropic工程师写代码效率翻了8倍。但编码问题解决了,验证又成了新痛点。来听听Claude Code团队经理怎么说。原文
13:26lmarena.ai@lmarena_aiAgent Arena的因果追踪方法论博客已发布。该方法论用于分析智能体在Agent Arena中的因果链。读者可通过博客深入了解Agent Arena的评估设计。论文Agent Arena因果追踪智能体推荐理由:想搞懂Agent Arena怎么分析智能体因果链的?这篇博客讲得明明白白。原文
13:25Philipp Schmid@_philschmid精选Interactions API 引入了 background=True 参数,用于处理超过标准 HTTP 超时限制的长时间运行异步代理任务。官方发布使用指南,说明如何配置请求、在任务完成后重新连接以及流式传输结果。该参数允许客户端在提交任务后立即返回,而无需保持连接直到任务完成。技巧Interactions APIbackground=True异步任务教程推荐理由:写异步 agent 任务总超时?试试 Interactions API 新加的 background=True,可以断开等结果再重连,还支持流式。原文
13:24techcrunch@Rebecca Bellan83°OpenAI应美国政府请求,对GPT-5.6模型的发布范围实施了限制。该公司声明称,这种政府介入的审批流程不应成为长期默认做法。OpenAI担忧限制会让用户、开发者、企业和网络安全防御者无法获得最先进的AI工具。行业OpenAIGPT-5.6模型发布AI监管政府干预10 个信源在谈推荐理由:OpenAI在政府压力下限制了GPT-5.6发布,却公开反对这种模式。看他们如何平衡安全与开放。原文
13:23Jerry Liu@jerryjliu0精选LlamaParse现已成为n8n的官方验证社区节点,提供Parse、Extract、Classify、Split、Retrieve五大核心功能。用户可在n8n工作流中构建文档提取流程(如贷款处理)或索引文档知识库并接入AI Agent。该节点支持将每个资源作为可调用工具,让AI Agent自主决定何时检索上下文、解析文件或提取结构化数据。AI产品LlamaParsen8nLlamaIndex文档解析智能体推荐理由:LlamaIndex的文档解析工具正式入驻n8n,能处理复杂文档的提取、分类和检索,还能让AI Agent自主调用,搭建工作流超方便。原文
13:22Gary Marcus@GaryMarcusDavid Shor的观察指出,选民对AI导致的就业替代问题态度出奇一致地左倾。他提到,对企业征税来资助相关项目通常是争议性话题,但在AI失业问题上两党存在广泛共识。这表明美国政治在AI转型初期已形成某种政策共识。行业AI就业替代政策民意税收补贴推荐理由:这个民意发现挺有意思:左右两派在AI失业问题上居然都支持征税补贴,对理解未来AI政策走向很有参考价值。原文
13:21LangChain@LangChainAILangChain与Chime合作发布指南,指导金融服务团队如何利用更强的监督机制构建生产级AI智能体。该指南涵盖LangChain框架的使用,强调可观测性、合规性和风险控制。指南提供具体步骤,帮助团队实现更可靠的AI部署。技巧LangChainChime智能体AI安全推荐理由:LangChain出了个新指南,专门讲金融服务怎么搞生产级智能体,还加了更强监督。做金融AI的可以看看,省了自己踩坑。原文
13:21Mustafa Suleyman@mustafasuleymanMustafa Suleyman在推文中详细阐述了微软AI团队的核心文化原则,包括科学严谨性优先、保持精简团队、数据无黑箱、自己使用自家模型等9条准则。他强调基于假设验证和数据驱动决策,反对过早庆祝结果,并要求所有成员对自己的数据负责。这些原则旨在通过纪律性和证据导向的方法论来加速模型迭代。行业Microsoft AIMustafa SuleymanAI文化团队管理推荐理由:微软AI负责人亲自写的团队工作准则,全是干货——怎么避免数据作弊、怎么做消融实验,做AI的都可以参考。原文
13:20LangChain@LangChainAIAlex Olsen 加入 LangChain 团队后发表首篇文章,详解 Deep Agents 如何利用 prompt caching 技术减少 API 调用次数。该方案通过缓存重复提示词,最高可降低 50% 的 API 成本。文章提供了具体实现步骤和代码示例,帮助开发者快速集成。技巧LangChainDeep Agentsprompt caching成本优化推荐理由:LangChain 新成员 Alex 手把手教你给 Deep Agents 加缓存,省下一半 API 钱,实用技巧别错过。原文
13:19techcrunch@Russell BrandomAI模型能力已进步到足以产生真实政治后果的程度。例如,模型可能影响选举和公共言论,引发社会争议。应对这些后果需要跨公司的集体行动,而非单纯关注Anthropic和OpenAI的竞争。这一转变要求各方共同制定AI治理框架。行业AnthropicOpenAIAI治理政治影响10 个信源在谈推荐理由:这篇文章点出了一个关键转变:AI竞争不再是两家公司的事,而是整个人类社会的治理挑战。关心AI安全和政治影响的人一定要看看。原文
13:17HeyGen@HeyGen_OfficialHeyGen发布了新一代HyperFrames技能,包含9种可自动路由的视频工作流。智能体能够从上下文理解用户意图,自动匹配到启动视频、音乐视频、字幕和叠加等任务。用户无需手动切换,直接输入指令即可触发对应功能。该更新显著提升了AI视频制作的自动化程度。AI产品HeyGenHyperFrames视频生成智能体推荐理由:HeyGen的HyperFrames升级后,智能体能听懂你让它做哪种视频,直接开搞,不用自己选模板了,省事多了。原文
13:16a16z@a16za16z最新图表显示,AI原生初创公司平均员工数显著低于传统科技初创公司。其中,AI原生公司中位员工数为10人,而非AI初创公司中位数为25人。a16z分析了2023-2024年成立的3000多家初创公司数据。这一趋势反映了AI工具对团队效率的提升作用。行业a16zAI原生初创公司员工规模行业趋势推荐理由:a16z用数据告诉你,AI初创公司为什么人少效率高。看看AI怎么帮团队瘦身。原文
13:15Simon Willison’s Weblog(博客/媒体)精选Andrew Nesbitt发布虚构事件报告CVE-2026-LGTM:两个来自不同供应商的AI审查代理在评估foxhole-lz4包是否恶意时陷入分歧循环。争论持续340条评论,消耗41,255美元推理费用后财务部撤销API密钥。其中一家营销团队借机发布新闻稿,称“对抗性多智能体安全推理同比增长430%”,公司股价因此上涨6%。行业CVE-2026-LGTMAI安全供应链安全多智能体提示注入推荐理由:Andrew Nesbitt虚构了一个AI安全事件:两个审查代理死循环争论,烧掉4万多美元推理费,还给股价整涨了6%。讽刺又真实。原文
13:14OpenRouter@OpenRouterAI推文展示了如何使用OpenRouter的MCP功能构建一个模型委员会(Model Council),并针对用户的代码库和用例进行调优。该工作流由用户Lennox Saint验证,确认效果出色。示例提供了可操作的步骤,帮助开发者利用多个模型协作解决问题。技巧OpenRouterMCP模型委员会智能体提示词工程推荐理由:OpenRouter官方示范,手把手教你用MCP搭模型委员会,实测好用。原文
13:13elvis@omarsar084°OpenAI 宣布了 GPT-5.6 系列,包括前沿模型 Sol、均衡模型 Terra 以及快速廉价模型 Luna。目前仅提供有限预览,少数用户可访问。评论者担忧这种策略不利于行业,呼吁开源AI取胜。AI模型GPT-5.6OpenAISolTerraLuna开源模型10 个信源在谈推荐理由:OpenAI 刚出了三个 GPT-5.6 模型,有强有快有便宜,但只给少数人用,引起争议。原文
13:12Simon Willison’s Weblog(博客/媒体)Fernando Irarrázaval 在 hackmyclaw.com 发起挑战,使用 OpenClaw 测试实例(基于 Opus 4.6 模型)验证能否通过邮件泄露秘密。6000 次攻击尝试消耗了 500 美元 token 并导致 Google 账号暂停,但无人成功。挑战中的反注入提示规则防止了模型泄露 secrets.env 或执行代码。作者认为前沿模型(如 Opus 4.6)在抗提示注入方面训练有效,但警告生产系统仍需谨慎。行业OpenClawOpus 4.6提示注入AI安全安全测试2 个信源在谈推荐理由:别人花了 500 美元做实验,6000 次攻击没得手,但这不意味着你也能保险。读读这个真实测试。原文
13:11techcrunch@Theresa Loconsolo81°OpenAI宣布与Broadcom合作开发名为Jalapeño的定制推理芯片,加入Google、Apple、SpaceX等公司的自研芯片行列。此举旨在降低对Nvidia AI芯片的单一供应商依赖,Nvidia目前占据AI芯片市场主导地位。越来越多科技巨头开始自研芯片,芯片行业竞争格局正在发生变化。行业OpenAISpaceXNvidiaAI芯片芯片自研10 个信源在谈推荐理由:OpenAI和SpaceX都在造芯片了,这次Nvidia的霸主地位可能真要动摇了,看看他们是怎么联手Broadcom搞事的。原文
13:07Simon Willison’s Weblog(博客/媒体)89°OpenAI 发布 GPT-5.6 系列有限预览,包括旗舰模型 Sol、平衡模型 Terra 和快速廉价模型 Luna。Terra 性能与 GPT-5.5 相当,但成本降低 2 倍,输入每百万 tokens 仅 $2.50。Luna 为最低价选项,输入每百万 tokens $1。该系列引入可预测的提示缓存,支持显式缓存断点和 30 分钟最短缓存生命周期,缓存写入按 1.25 倍计费,读取享 90% 折扣。OpenAI 计划未来几周全面开放,并应美国政府要求先向可信伙伴提供预览。AI模型GPT-5.6OpenAISolTerra推理模型10 个信源在谈推荐理由:OpenAI 出了三个新模型 Sol、Terra、Luna,Terra 和 GPT-5.5 差不多但便宜一半,Luna 超低价。还改了缓存计费规则,省钱又灵活。原文
13:06lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Code Arena 前端排行榜上获得第2名,比 Claude Opus 4.7 (Thinking) 高出 29 分。在 React 子榜单排名第2,HTML 子榜单第4。在品牌营销、数据与分析、消费产品等6个子类别中均位列第一。该模型是开源模型中对 Kimi-K2.6 和 Minimax-M3 优势最大的。在社区投票的单次前端编码测试中展示了10个对比案例。AI模型GLM-5.2Code ArenaClaude Opus 4.8开源模型编程助手2 个信源在谈推荐理由:GLM-5.2 在社区投票的编码竞技场上压过 Claude Opus,你可以在前端任务中试试它的单次生成效果。原文
13:05marktechpost@Michal SutterOpenAI于2026年6月26日预览GPT-5.6系列,包含Sol、Terra、Luna三个分层模型。新引入max和ultra两种推理模式,分别针对高复杂度与极致推理任务。该系列目前仅向部分用户开放有限访问权限。AI模型GPT-5.6SolTerraLunaOpenAI推理模型10 个信源在谈推荐理由:OpenAI的新模型GPT-5.6出了三个版本Sol、Terra、Luna,多了max和ultra两种推理模式,现在有限开放了,想体验的可以关注。原文
13:04orange.ai@oran_georan_ge基于Cola的token消耗统计发现,GLM 5.2正在取代Claude Sonnet和Opus,成为付费用户最爱的模型。DeepSeek v4 Pro依然是大众用户中最受欢迎的模型,而GPT 5.5虽然强大但几乎无人使用。这一数据同时反映了Cola与Codex用户(GPT 5.5受众)画像是完全不同的。行业GLM 5.2DeepSeek v4 ProGPT 5.5模型趋势用户偏好1 个信源在谈推荐理由:oran_ge用Cola数据发现一个反常识现象:GLM 5.2在抢Claude的付费用户,而GPT 5.5却没人用,值得看看原文
13:03Decoder@Matthias Bastian84°OpenAI发布新旗舰模型GPT-5.6 Sol,在编码基准上超过Anthropic的Claude Mythos 5。美国政府强制要求受限部署,OpenAI称这种政府访问规则不可持续。AI模型GPT-5.6 SolClaude Mythos 5OpenAIAnthropicAI监管10 个信源在谈推荐理由:OpenAI的新模型GPT-5.6 Sol在编码上赢了Claude Mythos 5,但政府限制部署让OpenAI不满,挺有争议。原文
13:02techcrunch@Jagmeet SinghOpenAI挖来Uber印度负责人Prabhjeet Singh,负责领导其在美国之外的最大市场——印度。这一任命标志着OpenAI在印度加速扩张,包括增设办公室、加强合作伙伴关系并扩大招聘规模。印度是OpenAI继美国后的第二大市场,用户增长迅速。行业OpenAIUber印度市场扩张行业动态10 个信源在谈推荐理由:OpenAI从Uber挖来印度负责人,专攻这个美国外最大市场,看来要认真开拓印度了。原文
13:01LangChain@LangChainAI精选SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察:在真实对话中,决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话,模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。行业LangChainSierraPlatform语音代理智能体推荐理由:Sierra的语音代理模仿人类并行处理对话,不是简单轮流说话,值得做语音产品的朋友看看。原文
12:57OpenRouter@OpenRouterAI精选OpenRouter发布了一个MCP演示,展示agent如何通过MCP从DesignArena拉取实时设计模型排行。演示中,agent同时启动GLM-5.2、Opus 4.7和Kimi 2.6三个子模型,各自生成自画像网页并排展示。用户可以直接对比三个模型的输出,选择最喜欢的设计。这种方式省去了手动注册多个平台、重复输入提示词的繁琐流程。技巧OpenRouterMCP/工具GLM-5.2Opus 4.7Kimi 2.6推荐理由:OpenRouter演示了怎么用MCP让agent自动调用GLM-5.2、Opus 4.7、Kimi 2.6三个模型并排出设计图,再也不用一个个手动试了。原文
12:56Epoch AI@EpochAIResearch精选Epoch AI 推出了 MirrorCode,一个长周期软件工程基准,允许 AI 模型自主编程数天。最佳模型(如 GPT-4、Claude 3.5)在部分任务上表现达到人类工程师数周的工作量。该基准包含超过 50 个复杂编程任务,每个任务需要多步代码修改和调试。结果显示,当前 AI 在处理持续数小时的工程任务时仍面临挑战,但进步显著。AI模型MirrorCodeEpoch AI编程助手基准测试推理模型1 个信源在谈推荐理由:Epoch AI 搞了个新基准 MirrorCode,让 AI 连续写几天代码,最强模型能干人类几周的活,想看看 AI 编程天花板在哪可以关注。原文
12:55Cohere@cohere88°OpenAI计划在未来几周内广泛发布GPT-5.6的三个变体Sol、Terra和Luna。应美国政府要求,目前仅在Codex和API中对少数可信合作伙伴开放有限预览。OpenAI表示相信广泛访问,但需确保安全。AI模型OpenAIGPT-5.6AI安全编程助手10 个信源在谈推荐理由:OpenAI要发GPT-5.6了,有三个版本(Sol、Terra、Luna)。现在只有政府批准的合作伙伴能试,几周后全面开放。想尝鲜可以关注Codex和API的预览。原文
12:53lmarena.ai@lmarena_aiAgent Arena排行榜已正式上线,用户可通过链接访问页面查看详情。排行榜支持按开放模型或实验室(lab)进行筛选过滤。目前该页面已有400次浏览,由xgo.ing提供技术支持。AI模型Agent Arena智能体评测基准开源模型实验室推荐理由:想看看谁家的智能体最强?Agent Arena排行榜刚上线,可以按开源模型和实验室筛选,挺方便。原文
12:51Harrison Chase@hwchase17Vercel Developers 发布了 AI SDK Harness API 的更新,新增对 OpenCode 和 LangChain Deep Agents 的支持。该 API 通过统一的 HarnessAgent 接口,允许开发者在不同运行时之间切换而无需修改代码。这一更新简化了多智能体系统的集成和部署流程。开发者现在可以同时利用两个平台的高级智能体能力。AI产品VercelHarness APIOpenCodeLangChainDeep Agents推荐理由:Vercel 的 Harness API 现在能一个接口同时跑 OpenCode 和 LangChain 的深度智能体,不用改代码,太方便了。原文