01:24lmarena.ai@lmarena_ai精选Zai_org的GLM系列在Code Arena: Frontend基准上持续增长,GLM-4.6得分1408,GLM-5.2 (Max)达到1595,超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型,在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。AI模型GLMZai_orgCode Arena前端编码开源模型推荐理由:Zai_org的GLM-5.2开源模型在前端编码上超过了Opus,离领先的Claude Fable只差一点,值得试试原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
01:08Paul Graham@paulgRippling 推出 Data Cloud,这是一个从头重建的现代数据堆栈,深度集成 AI。它围绕组织和员工数据构建,旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。AI产品RipplingData Cloud企业数据AI集成推荐理由:Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层,适合需要稳定又前沿方案的买家。原文
01:04Figma@figmaFigma 发布了 MCP connectors,让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol(MCP)标准,目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具,扩展设计工作流。Figma 表示后续将开放更多连接器选项。AI产品FigmaMCP设计工具智能体10 个信源在谈推荐理由:Figma 出了 MCP 连接器,让设计 agent 能直接调用 Slack、Notion,工作流更顺了。原文
01:03a16z@a16zNetris完成由a16z领投的1500万美元Series A融资,该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行,历经8年积累。过去12个月,Netris的ARR增长800%,部署超过35个AI集群,超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作,为AI基础设施解决East-West、OOB等复杂网络配置难题。行业Netrisa16zGPU集群网络自动化数据中心5 个信源在谈推荐理由:a16z领投的1500万美元融资,Netris专治GPU集群网络管理的难题,ARR一年涨8倍,部署量超对手总和,值得关注。原文
01:02AK@_akhaliq一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。行业智能体内存系统AI架构长期记忆推荐理由:有人在聊智能体要不要有自己的记忆系统,思路挺新鲜的,点开看看讨论。原文
00:58AWS Machine Learning Blog@Venkata Sistla精选AWS发布了一篇博客,展示如何利用现代数据网格策略构建受治理的无服务器数据网格。该方案基于AWS无服务器架构,提供安全、可扩展的数据基础。文章详细说明了如何为生产级Agentic AI应用搭建数据网格。它涵盖了数据治理、访问控制和数据共享等关键环节。技巧AWS数据网格Agentic AI无服务器云服务推荐理由:想用AWS搞Agentic AI?这篇手把手教你搭数据网格,安全又省心。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:57AWS Machine Learning Blog@Aurelio DeSimone精选AWS发布了Chaplin开源方案,利用AI代理通过模型上下文协议(MCP)提供自助健康事件分析。Chaplin基于Amazon Bedrock,可自动聚合AWS Health事件并提供可操作建议。该方案支持自然语言查询,无需编写复杂代码即可洞察AWS资源健康状态。用户可快速部署并自定义MCP服务器来扩展分析能力。技巧Amazon BedrockChaplinMCP智能体AWS服务推荐理由:AWS出了个叫Chaplin的开源工具,用Bedrock的AI代理配合MCP协议,让你自然语言查AWS健康事件,不用写代码就能找到问题原因。原文
00:56AWS Machine Learning Blog@Nick Biso精选本文演示了如何在Amazon SageMaker AI上部署SeedVR2进行视频超分辨率。介绍了解决方案架构和具体部署步骤。通过性能对比展示了SeedVR2在视频放大质量和处理效率上的提升。技巧SeedVR2Amazon SageMaker AI超分辨率视频增强模型部署推荐理由:AWS教你用SeedVR2在SageMaker上给视频做超分辨率,有步骤有对比,想试试高清视频放大可以看看。原文
00:55AWS Machine Learning Blog@Andrea Gallo精选本文介绍如何在Amazon SageMaker AI上利用NVIDIA Blackwell架构优化训练配置。包括根据模型大小(1B到64B参数)选择合适精度格式,调整batch size和序列长度以利用Blackwell扩展内存,以及策略性应用激活检查点。通过P6-B200实例启动分布式训练,提供一套实用的训练调优框架。技巧Amazon SageMaker AINVIDIA BlackwellP6-B200实例训练优化编程助手5 个信源在谈推荐理由:AWS发了篇实战教程,教你用NVIDIA Blackwell在SageMaker上调优训练,从选精度到调batch size都讲清了,搞大模型训练的人别错过。原文
00:54techcrunch@Russell Brandom前Databricks AI负责人创立新公司,声称其技术可将AI系统电力消耗降低1000倍。该公司首个产品是图像生成系统Un0,能复现传统AI模型的功能但能耗极低。该声称基于硬件与算法协同优化,但尚未有第三方验证数据。若属实,可能大幅降低大规模AI部署的运营成本。行业DatabricksUn0图像生成AI能效推荐理由:前Databricks AI老大搞了个新公司,说能让AI耗电降到原来的千分之一,他们先做了个图像生成系统Un0,如果真能兑现,那AI成本得崩盘。原文
00:53@koltregaskes@koltregaskes76°Google在AI Studio中发现了Gemini Omni Flash的预览版公告,将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。AI产品Gemini Omni FlashGoogle AI Studio视频生成4k60秒输出推荐理由:谷歌要在AI Studio上线Gemini Omni Flash预览版,能生成4k分辨率、60秒的视频,视频长度很顶。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
00:27Decoder@Matthias Bastian《华盛顿邮报》的一项调查发现,多数主流AI聊天机器人在政治问题上存在左倾倾向。OpenAI的GPT-5.5在80%的情况下只提供左倾论点。马斯克旗下标榜'反觉醒'的Grok模型也更多偏向左倾。唯一的例外是谷歌Gemini 3.1 Pro,它在93%的测试中呈现了双方观点。行业GPT-5.5GrokGemini 3.1 ProAI偏见政治倾向10 个信源在谈推荐理由:想知道你用的AI聊天机器人有没有政治立场?《华盛顿邮报》测了GPT-5.5、Grok和Gemini 3.1 Pro,结果左倾现象普遍,连Grok都没逃过。来看看数据。原文
00:26shao__meng@shao__mengSuperNori 是一款针对家庭照料者的 Proactive Family AI Agent,能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作,AI 会在合适时机询问是否处理。该项目已开放候补名单,目标减轻家庭中总在照顾他人的那个人的负担。AI产品SuperNori家庭AI智能体主动提醒1 个信源在谈推荐理由:家里总是你操心?SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么,不用你一个个记,试试看。原文
00:24techcrunch@Aisha MalikGoogle 为 Android 用户推出独立的 Google Finance 应用,整合实时市场数据、财经新闻与自选股管理。该应用内置 AI 驱动的“Key Moments”功能,用于自动解析个股涨跌原因。用户无需跳转网页即可直接在应用内获取实时行情和金融资讯。AI产品Google FinanceAndroid实时市场数据AI功能金融信息推荐理由:Google Finance 终于有专属 Android 版了,还有 AI 帮你解释股票为啥涨跌,炒股的朋友可以装起来。原文
00:24Firecrawl@firecrawl_devFirecrawl MCP 发布新功能,文档解析速度提升5倍。支持PDF、电子表格和文档,可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器,无需API密钥即可在免费层试用。AI产品FirecrawlMCP文档解析智能体PDF推荐理由:Firecrawl MCP 现在解析文档快了5倍,免费就能用,让你的智能体直接读PDF和表格。原文
00:06techcrunch@Rebecca BellanAI公司General Intuition在最新一轮融资中筹集3.2亿美元,累计融资额达23亿美元。该公司利用《堡垒之夜》等数百万小时游戏数据训练AI智能体,旨在让AI学习人类直觉。其技术已应用于机器人领域,让机器人在虚拟环境中习得技能后迁移到现实。投资人包括软银、微软等,投后估值约60亿美元。行业General IntuitionFortnite机器人智能体融资推荐理由:General Intuition用游戏数据训AI机器人,刚融了3.2亿,和普通算法训练思路不一样,感兴趣可以看看。原文
00:01Geek@geekbbNyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台,集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源,适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面,支持多种协议和高级功能。AI产品TauriReactRustNyaterm远程终端2 个信源在谈推荐理由:Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上,用Tauri/React/Rust做的,开源免费,适合运维和开发者。原文
23:59OpenRouter@OpenRouterAI精选OpenRouter推出全新Benchmarks API,允许agent实时查询模型基准分数,涵盖Artificial Analysis和Design Arena两个评测平台。该API数据显示,Zai_org的GLM-5.2在编码和设计两类基准中均为当前最佳可用模型。API文档已随推文发布,开发者可集成使用。AI产品OpenRouterBenchmarks APIGLM-5.2Zai模型评估推荐理由:想给AI agent加实时模型排名?OpenRouter新API能查GLM-5.2在编码和设计上的分数,挺实用。原文
23:57Gary Marcus@GaryMarcusAlice预测未来2年内AI股票泡沫崩溃,市场将出现类似2008年的大规模修正。大部分AI公司倒闭,但云提供商和芯片制造商可能幸存。Anthropic和OpenAI等推理公司可能被政府救助否则违约。AI应用集中在聊天机器人、设备端助手(苹果)和医疗影像,主要由开源或设备端模型驱动。教育领域AI使用降低学生质量,学校转向课堂纸笔考试。行业AnthropicOpenAI开源模型设备端模型10 个信源在谈推荐理由:一位读者做出了具体AI行业预测,从泡沫到公司倒闭、从开源主导到教育影响,观点尖锐,值得一读。原文
23:55elvis@omarsar0Hyperagent是一款为本地agent提供专属云端机器的服务,解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分,迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。AI产品Hyperagent智能体云端推理Andrew Busse3 个信源在谈推荐理由:如果你受够了本地agent崩溃和泄露,Hyperagent给每个agent配云端专机,新用户还能拿600美元积分,赶紧试试。原文
23:55Tw93@HiTw93Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论,构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看,所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。技巧MoleAI数据整理用户反馈社交媒体推荐理由:这个项目用AI从社交平台扒出所有夸Mole的留言,拼成一面故事墙,还能找到有没有你的身影原文
23:54IT之家(博客/媒体)73°谷歌重组了成立仅数月的AI编程攻坚小组,扩大其业务范围并正式固化团队架构,试图缩小与Anthropic的技术差距。此前,核心研究员Jonas Adler和Alexander Pritzel计划离职转投Anthropic,两人均被视为Gemini模型关键贡献者。近期谷歌还流失了诺贝尔奖得主John Jumper(跳槽Anthropic)和Gemini联席负责人Noam Shazeer(加盟OpenAI)。此外,谷歌下一代替换模型Gemini 3.5 Pro的发布已推迟至7月,此前CEO桑达尔·皮查伊在5月I/O大会上称该模型将于“次月”发布。行业谷歌AnthropicGemini 3.5 Pro人才流失团队重组10 个信源在谈推荐理由:谷歌AI编程小组重组,但关键研究员全跑去了Anthropic,连Gemini 3.5 Pro都得延期到7月,想追上对手难了。原文
23:46OpenRouter@OpenRouterAIOpenRouter 发布新功能,允许用户通过两条命令(claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter)在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP(Model Context Protocol),支持所有主流代理(如 Claude)。用户可在 openrouter.ai/mcp 立即使用。技巧OpenRouterClaudeMCP智能体工具推荐理由:OpenRouter 搞了个骚操作,两行命令就能把模型接到 Claude 等代理里,一分钟搞定测试和定价,省去一堆配置。原文
23:45OpenRouter@OpenRouterAI精选OpenRouter推出MCP(模型上下文协议),使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试,替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型,提升效率。AI产品OpenRouterMCP智能体模型选择实时模型推荐理由:OpenRouter新出的MCP能让你的AI智能体实时选模型,不用瞎猜了,还能比价测试,直接集成。原文
23:39Geek@geekbbGitHub项目'no-xxx'在代码推送前自动运行AI审查。审查通过标记为绿灯。只有绿灯更改才被推送到远程仓库。生成无垃圾代码的干净PR。该流程可集成到Git工作流中。AI产品AI代码审查PR自动化GitHub推荐理由:推送前自动跑AI审查,省心省力,再也不用手动清理垃圾代码了。原文
23:37berryxia@berryxiaOrnith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。AI模型Ornith-1.0Terminal-BenchSWE-BenchOllama智能体推荐理由:Ornith-1.0 用 RL 教模型搭执行框架,在 SWE-Bench 上表现顶尖,本地党还有 GGUF 版本可玩。原文
23:27techcrunch@Ram IyerNetris是一家提供网络交换机软件的公司,其平台帮助AI neocloud运营商将上线时间从数月缩短至数周。该公司宣布完成1500万美元的Series A轮融资,由a16z领投。资金将用于扩大团队并拓展客户,支持更多AI云基础设施快速部署。行业Netrisa16zAI neocloud融资云基础设施1 个信源在谈推荐理由:Netris拿了a16z 1500万美元,专门帮AI新云运营商快速上线,从几个月压缩到几周。原文
23:24Guillermo Rauch@rauchg精选AI SDK 7正式发布,新增推理控制(reasoning control)和代理级工具审批(agent-level tool approval)功能。支持MCP应用、持久化工作流(durable workflows)和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。AI产品AI SDKaisdkMCP/工具推理控制智能体推荐理由:AI SDK 7来了,新增推理控制和代理工具审批,还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。原文
22:57Viking@vikingmute推文介绍了ponytail项目和一个Vibe Coding提示词技巧,建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案,直接复用”。该技巧基于DRY理念,能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。技巧ponytailGPT提示词工程Vibe Coding编程助手推荐理由:给用GPT写代码的人:提示词末尾加‘复用开源方案’能防止AI重复造轮子,亲测有效。原文
22:56IT之家(博客/媒体)精选华为在MWC上海2026携手中国移动、中国联通、中国电信发布了5G-A大上行、AI焕新主营业务和Token经营等创新成果。华为同时发布了AI-Centric目标网架构。U6GHz被定位为Token经营时代的下一代频谱,已有超20个国家和地区明确用于国际移动通信,2026年被视为商用元年。中国移动与华为联合打造的无线网络智能化方案获得GLOMO Asia“最佳AI驱动网络解决方案奖”和“最佳气候行动移动创新奖”。该方案已在六大省市覆盖20万站点、100万小区,质差工单自动闭环率提升至15%,全网额外节能增益5.5%。行业华为5G-AU6GHzToken经营移动AI推荐理由:华为和三家运营商一起搞了5G-A大上行和Token经营方案,还拿了国际大奖,U6GHz也确定今年商用,挺实在的进展。原文
22:55向阳乔木@vista8一位用户收到并分享了第一封由AI Agent自动生成的邮件,该邮件内容未经人工直接干预。邮件发送者未具体说明使用哪个Agent产品,但标志着AI驱动的自动化通信迈出实际一步。该推文获得460次浏览,引发对Agent应用场景的讨论。行业AI Agent邮件自动化推荐理由:朋友收到AI代理自己发的邮件了,挺新鲜,看看AI悄悄帮你干活的样子。原文
22:54IT之家(博客/媒体)2025年中国具身智能市场规模约9150亿元,预计2026年将达10904亿元。全国具身智能相关企业数量已突破万家。链博会展示了从核心零部件到整机系统的产业闭环。国家发改委表示将加快训练基础设施建设,推进具身智能进入工厂、商场和家庭。教育部2026年本科专业目录新增具身智能等专业。行业具身智能机器人市场规模政策产业链推荐理由:市场规模已经9150亿了,年底就要破万亿,而且国家在推、大学在开专业,这赛道真的起飞了。原文
22:39向阳乔木@vista8腾讯推出了一款专为Agent设计的邮箱服务,允许用户抢注邮箱名。注册后,用户会获得一段提示词,可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程,无需手动编写脚本。目前该功能已开放注册,用户可通过评论区链接体验。技巧腾讯Agent邮箱Codex提示词工程推荐理由:腾讯出了个给Agent用的邮箱,注册后拿到提示词就能让Codex自动配好CLI,省得自己写命令,挺方便的。原文
22:22Decoder@Maximilian Schreiner保险公司开始使用扩散模型等生成式AI技术进行灾难建模,可生成数万个历史数据中不存在的合理天气事件。他们希望借此进行更精确的风险评估。然而研究人员警告称,AI生成的模拟事件可能存在幻觉和销售逻辑误导,影响实际决策准确性。行业保险公司生成式AI灾难建模幻觉风险评估推荐理由:保险公司用生成式AI做灾害建模,能补历史数据缺漏,但小心AI幻觉和销售套路,实际效果还得看验证。原文
22:21IT之家(博客/媒体)精选73°Adobe 宣布收购 AI 图像和视频增强工具开发商 Topaz Labs,交易预计在 2026 年下半年完成,尚需监管批准。Topaz Labs 拥有超过二十年的技术积累,2025 年因其生产技术获得艾美奖,其产品包括用于视频放大升频的 Astra 模型和图像润饰的 Wonder 模型,以及让大型 AI 模型在消费级 GPU 上本地运行的 Neurostream 技术。Adobe 计划将 Topaz Labs 的 AI 模型整合到 Firefly 应用以及 Photoshop、Lightroom、Premiere 等 Creative Cloud 产品中,同时保留其独立服务。行业AdobeTopaz LabsFireflyPhotoshop视频增强推荐理由:Adobe 买下获艾美奖的 AI 视频增强公司 Topaz Labs,以后 Photoshop 和 Premiere 里就能直接用它的降噪、放大功能,处理老旧素材很方便。原文
22:00LangChain@LangChainAI精选LangChain 推文指出通用聊天适合一次性问答,答案出现即结束。专门智能体适合重复性、有固定形状的工作,使用相同工具和格式。智能体能记住线程可能遗忘的上下文,适合多次运行相同流程。技巧LangChain智能体提示词工程推荐理由:LangChain用一句话说清楚了选择原则:如果下次解释方式一样,就该用智能体,别放聊天里。原文