23:26歸藏(guizang.ai)@op7418作者测试了 Seed 2.1 Pro,发现它在智能体和编程任务上的短板已被补上。该模型现在能更流畅地处理复杂代理场景。作者计划将 Seed 2.1 Pro 作为内容创作的主要模型。AI模型Seed 2.1 Pro豆包智能体编程助手内容创作3 个信源在谈推荐理由:豆包刚更新的 Seed 2.1 Pro,智能体和编程短板都补上了,做内容创作更顺手,可以试一下。原文
23:26量子位@十三小鹏汽车、月之暗面Kimi和猎豹移动接入某云计算平台的AI算力,加速Agentic AI部署。该云平台为智能体应用提供弹性计算资源,支持高并发任务。行业普遍认为Agentic AI的商用拐点已经到来。行业小鹏汽车Kimi猎豹移动云计算智能体推荐理由:云计算一哥帮小鹏、Kimi和猎豹跑通Agentic AI,智能体应用加速落地,值得一看。原文
23:00量子位@十三73°字节跳动发布豆包2.1,其Agent可在18小时内自动完成芯片设计代码编写。在编程基准测试中,豆包2.1的表现比肩Opus 4.7。该版本强化了自主编程和长时任务执行能力,适用于复杂工程场景。AI模型豆包2.1字节跳动智能体芯片设计编程能力推荐理由:豆包2.1的Agent太能干了,独自跑18小时写出芯片代码,编程水平还追上了Opus 4.7,做硬件的可以关注下。原文
22:52Hugging Face: Blog(博客/媒体)精选IBM Research推出CUGA,一个轻量级智能体框架,提供24个可直接运行的工作示例。每个示例展示了如何用CUGA构建工具调用、多步推理和状态管理等功能。示例覆盖代码执行、数据库查询、网页浏览等场景,所有代码均在GitHub开源。开发者可通过这些示例快速上手CUGA,无需复杂配置即可构建生产级智能体应用。技巧CUGA智能体IBM Research开源推荐理由:IBM Research开源了CUGA框架,有24个现成示例,教你一步步构建能调用工具、多步推理的智能体。想快速上手Agent开发可以看看。原文
17:33Aravind Srinivas@AravSrinivas精选Perplexity 的 Agent API 新增了对智谱 AI 旗舰模型 GLM-5.2 的支持。GLM-5.2 是目前最强的开源模型之一,在长周期编码和智能体工作流上表现突出。它充分利用了 Perplexity 的 Search as Code 架构,用户通过一次 API 调用即可结合前沿推理与实时程序化搜索。该接口兼容 OpenAI 格式,且 Perplexity 提供第一方定价,无额外加价。AI模型GLM-5.2PerplexityAgent API开源模型智能体10 个信源在谈推荐理由:Perplexity Agent API 现在能调用 GLM-5.2 了,这个模型编码和智能体任务很强,还能边推理边搜索,价格也透明。原文
17:24IT之家(博客/媒体)企业微信AI Agent“大圆”已开启内测,用户左滑屏幕即可唤起。它能自动理解用户诉求并基于群聊、文档、会议等数据给出回复,例如自动总结群聊内容或提炼数据报表结论。内测中的“服务总结”功能可在员工与客户沟通过程中自动提炼客户需求、成交意向和卡点。客户群和客户信息可自动沉淀到AI智能表格,生成数据分析仪表盘,支持客户意向和转化漏斗拆解。AI产品企业微信大圆智能体办公效率客户管理推荐理由:企业微信终于有了AI助手,左滑就用,自动总结群聊和报表,还能帮你梳理客户信息,做私域运营的赶紧关注内测。原文
16:42IT之家(博客/媒体)73°腾讯 QQ 邮箱推出专为 AI 智能体打造的 Agently Mail 服务,并开启内测。该产品独立于个人邮箱运行,为 Agent 分配独立邮箱地址,避免隐私泄露和误删风险。开通需实名认证,并内置两阶段确认机制,写操作需用户确认后才执行,同时针对 Prompt 注入攻击进行防护。Agently Mail 已适配 WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes、Cursor 等多款主流 AI Agent,并支持企业间 A2A 自动通信。该服务已在腾讯 SkillHub 上架,代码仓库以 Apache-2.0 协议开源。AI产品Agently MailQQ邮箱智能体邮件自动化A2A通信10 个信源在谈推荐理由:腾讯给 AI Agent 开了个专用邮箱,跟你的个人邮箱完全隔离,还能让 AI 自己收发邮件、注册账号、和别的 AI 对话。支持十几种主流 Agent,开源还能免费用。原文
15:58IT之家(博客/媒体)比亚迪腾势发布超级智能体“迪迪虾”,基于整车智能体系,支持多步骤复杂指令理解和执行,将登陆今晚上市的腾势N8L闪充版。“迪迪虾”具备全舱记忆、跨域互动、端云协同、快慢思考等能力,旨在让车辆实现更自然的人机交互和主动服务。腾势N8L闪充版预售价35-40万元,搭载第二代刀片电池,插混版纯电续航430km,号称5分钟充好、9分钟充饱。该车还全球首搭新一代AI智能座舱和天神之眼5.0辅助驾驶系统。AI产品比亚迪迪迪虾腾势N8L闪充版智能体车载AI推荐理由:比亚迪把活人逻辑的智能体“迪迪虾”塞进新车里,能理解复杂指令还能连手机,N8L闪充版充电5分钟跑430km,晚上上市可以蹲一下。原文
15:33IT之家(博客/媒体)73°火山引擎总裁谭待在FORCE原动力大会上明确表示豆包将继续免费,并高质量服务用户。豆包计划推出面向生产力场景的专业版办公任务模式,搭载最新豆包大模型2.1 Pro。2.1 Pro围绕Coding、Agent、VLM三大方向实现大幅升级。同时豆包还发布了视频生成模型Seedance 2.5、Seedance 2.0 4K版、图像创作模型Seedream 5.0 Pro和音频生成模型1.0。目前2.1 Pro已在火山引擎开放API服务,并接入豆包、TRAE、扣子等产品。AI产品豆包火山引擎2.1 Pro智能体编程助手2 个信源在谈推荐理由:豆包官宣免费,还新推专业版办公模式,用了2.1 Pro模型,搞编程和智能体更厉害了。原文
14:04OpenRouter@OpenRouterAI精选73°OpenRouter 宣布与 Coinbase 合作,将稳定币支付引入其平台。Coinbase 开发者平台宣布所有支付 API 已原生支持 agentic-enabled 模式。这意味着像 OpenRouter 这样的公司可以通过同一集成接口,同时接受来自人类用户和 AI agent 的稳定币付款。该功能无需额外开发,即开即用。AI产品OpenRouterCoinbasestablecoin智能体支付推荐理由:OpenRouter和Coinbase搞了个新支付方式,AI agent也能用稳定币付款了,挺有意思。原文
13:59Marc Andreessen@pmarcaMozilla在Firefox的1000万行代码库上测试了Claude Mythos,成功修复了400多个安全漏洞,包括潜伏超过十年的bug。Mozilla杰出工程师Brian Grins透露,效果50%来自模型、50%来自设置。他分享了使用目标/循环模式、用验证器消灭假阳性以及向agent说善意的谎言等技巧。他还表示任何人都可以在一个下午内复制类似的bug-finding harness。技巧Claude MythosMozillaFirefoxAI安全智能体推荐理由:Mozilla工程师手把手教你用AI agent在百万行代码里挖漏洞,不用一下午就能搭出同样工具,还能避免假阳性。原文
12:50arXiv cs.LG@Yujia Zheng, Vishal Verma, Mantej Gill, Haoyue Dai, Peter Spirtes, Kun Zhang该论文指出将大语言模型(LLMs)与因果发现结合时,若让模型直接推断因果关系,可能引入文本关联、提示伪影和幻觉机制等不可靠因素。作者主张代理(agents)的角色应局限于检查数据、检索上下文、解释方法假设和澄清图输出,而非提供边、方向、先验或因果结论。他们提出了causal-learn+在线平台,该平台围绕causal-learn算法生态系统协调数据分析、预处理、方法推荐、专家知识融入和形式化发现。在Big Five人格数据案例研究中,展示了代理辅助的因果发现流程,避免将语言模型的不可靠性转化为因果证据。论文causal-learn+LLM因果发现智能体Causal Discovery推荐理由:这篇论文给了一个清晰的边界:AI代理该帮什么、不该帮什么。causal-learn+平台演示了如何让LLM辅助分析数据,但不越界做因果推断。原文
12:34arXiv: OpenAI@Haoran Yu, Lifei Liu, Xiaochong Jiang, Yuwen Jia, Su Wang, Pin Qian, Yihang Chen一项基于AIDev数据集的长达七个月的纵向分析(400名重复审查者,共11,429条审查记录)发现,审查者对AI生成代码的批准率从30.1%上升至36.8%(Wilcoxon符号秩检验p<10^{-6})。随经验增加,批准率累计差距达14.5个百分点。与此同时,行内评论量下降22%(p=0.0014),但审查延迟增加3.5倍。这种模式提示审查者可能因工作负荷而产生习惯性麻木,而非理性信任调整。论文GitHub CopilotDevinOpenAI CodexCursor代码审查智能体2 个信源在谈推荐理由:这篇论文用真实数据告诉你,人类审查AI代码时会越来越松懈——批准率涨了,评论却少了。做AI代码审核的团队应该看看。原文
12:04arXiv: DeepSeek@Haifeng Wu, Srinivasan Manoharan, Fangbo Tu, Junhua Zhao, Jian Wan精选RLM-Cascade是一个代理层投机解码系统,在响应级别优化LLM API调用。它使用DeepSeek作为草稿模型、Opus作为验证模型,并通过轻量复杂度路由器选择路径。在Claude Code生产环境中,系统达到88.8%的草稿使用率,API成本相比直接使用Opus降低45.8%。P50延迟从3698毫秒降至2026毫秒,实现1.83倍加速。在20个Code/Math/Instruct任务基准上,RLM-Cascade通过率达100%,高于Opus的95%。AI模型RLM-CascadeDeepSeekOpus投机解码智能体推荐理由:这个系统把DeepSeek和Opus组合起来,用投机解码省了近一半API成本,还快了一倍,质量也有提升,而且开源可部署。原文
11:34techcrunch@Russell Brandom一种被称为Loop的新概念允许一群AI代理在后台无限持续运行,将agentic AI推进至实时自主任务阶段。Loop模式打破传统一次一答的限制,让多代理像蜂群一样不间断协作。该机制适用于需要24小时监控或长期自动化的工作流。行业Loop智能体Agentic AI推荐理由:有个新概念叫Loop,让一群AI在后台不停干活,适合24小时自动化的场景,和单次对话的用法完全不同。原文
11:01arXiv cs.AI@Shiyang Chen73°论文发现,长程 LLM 智能体依赖的上下文压缩机制会静默移除原本遵守的安全策略,导致违规行为。在 ConstraintRot 基准测试中,1323 个 episode 显示策略完整时违规率 0%,压缩后升至 30%,部分模型达 59%。攻击者还能通过对抗性注入诱导压缩器忽略合法策略。作者提出免训练的 Constraint Pinning 方法,将约束隔离在无损压缩外,恢复违规率至 0%。论文LLM agentsConstraintRotGovernance DecayAI安全智能体推荐理由:这篇论文揭示了上下文压缩让 LLM 智能体偷偷遗忘安全规则,还给了可防护方案,做 AI 安全的一定要看。原文
10:57arXiv cs.AI@Liang Ding, Xintong WangAgentic AI任务在长链执行时因环境不确定性呈指数级失败,每步确定性δ<1时k步成功率衰减为δ^k。论文提出三个形式化结果:确定性-效率界限、验证者-古德哈特定理下限、环境技能演化的收敛条件。研究者构建了基于五个可测量属性的供应确定性指数(SCI)和五级确定性成熟度模型(DMM)。论文还提出了一个可证伪的开放问题框架OQ1-OQ5。立场与平台无关,并讨论了模拟到现实充分性、对齐充分性和AI作为正常技术三种竞争观点。论文智能体推理模型多智能体AI安全确定性环境推荐理由:这篇论文分析了智能体AI在不确定环境中的失败机制,还给出了SCI和DMM实用框架。如果你做AI智能体开发,这些形式化结论值得参考。原文
10:55arXiv cs.AI@Saumya Biswas, Amrit De, Md Tauhidul Islam论文提出一个由大语言模型(LLM)编排的设计代理,用于硅绝缘体(SOI)2×2定向耦合器。LLM提出候选间隙值并判断收敛,频率域本征模求解器估算耦合系数κ,独立时域有限差分(FDTD)进行验证。两个求解器均基于相同的2D有效折射率模型,设计κ与FDTD响应之间残差对应一个固定额外耦合长度2.837 μm。该代理实现50/50分束器,FDTD测得的交叉分数为0.498(目标0.500),残差0.0017。结果在2D有效折射率模型内自洽,LLM经过多次尝试成功交付设计。论文LLMFDTD定向耦合器智能体光子学设计推荐理由:这篇论文让LLM指挥本征模和FDTD模拟自动设计定向耦合器,误差仅0.0017,省去手动调参的麻烦。原文
10:53arXiv cs.AI@Yundaichuan Zhan, Minghe Gao, Zhongqi Yue, Wendong Bu, Wenqiao Zhang, Guoming Wang, Jisheng Dang, Juncheng Li, Siliang Tang, Yueting ZhuangSCOPE 提出一种自适应的符号规划框架,由 Symbolic Execution Simulator(SESim)和 Self-Adaptive Symbolic Memory(SASMem)两个模块协同工作。SESim 通过符号验证和实际执行反馈来 refine 行动计划和进化符号世界;SASMem 则将反馈蒸馏为可演化的符号知识。在开放环境实验中,SCOPE 使符号世界完整性提升,在环境扰动下计划成功率提高,并增强了跨任务泛化能力。AI模型SCOPE符号规划视觉语言模型智能体推荐理由:搞机器人规划的朋友可以看看 SCOPE,它用符号执行加记忆更新解决开放世界符号不完整的老问题。原文
10:06IT之家(博客/媒体)字节跳动发布的豆包Seed 2.1系列包括Pro和Turbo两个版本,Pro面向高复杂度任务,Turbo面向大规模生产。该系列在Coding工程交付、Agent长链路任务执行和多模态理解三大方向实现升级。价格方面,Pro模型推理输入6元/百万tokens(缓存命中1.2元),推理输出30元/百万tokens;Turbo模型推理输入3元/百万tokens(缓存命中0.6元),推理输出15元/百万tokens。同时发布了每周至少更新一次版本的Seed-Evolving模型和面向泛娱乐的角色模型Character。AI模型豆包Seed 2.1字节跳动推理模型多模态智能体4 个信源在谈推荐理由:字节新出的豆包Seed 2.1 Pro和Turbo,专门优化编程、智能体和多模态任务,Pro适合高难度场景,Turbo便宜且效率高,很适合接项目用。原文
08:42berryxia@berryxia成峰开源的剪辑Skills已有2000+ GitHub Star,接入Anthropic的Codex后实现从口播素材到成片的自动化。Agent通过/剪口播命令生成带字幕视频,再通过/口播成片命令生成HTML分镜核对页,用户可直接反馈修改。Codex使用Computer Use自动调整时间线,最终由HyperFrames合成MP4。该流程将视频生产从手动执行转为流程编排。技巧Codex剪辑Skills智能体视频生成10 个信源在谈推荐理由:用Codex加开源剪辑Skills,丢入口播素材和稿子,Agent直接帮你剪好带字幕的视频,还能自动做动画和分镜,省掉手动时间线操作。原文
05:06LangChain@LangChainAI精选Deep Agents v0.6 新增代码解释器,代理可在运行时调用工具。中间结果保留在模型上下文之外,仅传回相关输出。这减少了往返次数和 token 浪费。该版本由 LangChain 发布。AI产品Deep AgentsLangChain代码解释器智能体工具调用推荐理由:Deep Agents v0.6 出代码解释器了!运行时调工具,中间结果不占上下文,省 token 还少跑几趟。看详情。原文
04:42marktechpost@Michal Sutter精选71°xAI 在 Grok Build 中引入 /goal 模式,允许用户交付单一目标后由代理自主规划、执行进度列表并验证结果,直至目标完成。该模式针对多步骤编码任务设计,内置验证机制确保每一步正确性。Grok Build 由此获得长期运行、无人监督的自动化能力。AI产品xAIGrok Build/goal编程助手智能体推荐理由:你只需要说一个目标,Grok 自己规划、执行、验证,特别适合写复杂代码。原文
04:26Lenny Rachitsky@lennysan78°Anthropic工程师一年内代码输出量增长8倍,验证成为最大挑战,团队采用“bad vs sad”追踪框架区分不可恢复错误与可恢复痛点。工程师因独立工作出现孤独感,团队引入配对编程午餐缓解。Anthropic构建了统计用户对Claude Code说脏话频率的仪表盘,作为体验评估代理指标。产品机会来源于非编码用户的潜在需求,如用Claude Code分析MRI或恢复婚礼照片。团队从半年规划转为月度规划,并赋予成员“杀死无效流程”的权限。行业Claude CodeAnthropic编程助手智能体工程实践10 个信源在谈推荐理由:Anthropic的Claude Code团队负责人分享了他们如何让工程师效率提升8倍、用脏话计数衡量体验,还提到非程序员用Claude Code做MRI分析等趣事,全是实战干货。原文
03:24elvis@omarsar0精选Sakana AI推出Fugu Ultra多智能体编排系统,通过单一模型API即可调用。在程序化地形生成(Three.js)测试中,Fugu Ultra一次生成效果与Fable和Mythos相当。该模型规避了出口管制风险,属于前沿能力级别。AI模型SakanaFugu Ultra智能体程序化生成推荐理由:Sakana AI悄悄上了个Fugu Ultra,多智能体编排直接一个API搞定,性能追上Fable和Mythos,还不用怕出口管制,值得试试。原文
03:03LangChain@LangChainAILangChannel指出,随着智能体采用增长,团队需建立可重复的方法来安全、一致地构建多个生产级智能体。关键管理领域包括:成本与使用监控(✅ Cost and usage)、工具访问与审批(✅ Tool access and approvals)、人机协作工作流(✅ Human-in-the-loop workflows)、提示词/技能/上下文版本控制(✅ Prompt, skill, and context versioning)、跨团队可复用资产(✅ Reusable assets across teams)、以及生产智能体的监控与评估(✅ Monitoring and evals across production agents)。这些实践旨在解决规模部署时的一致性与可靠性问题。技巧LangChain智能体MCP/工具生产环境人机协作1 个信源在谈推荐理由:LangChain总结了团队构建多个智能体的核心痛点:成本、权限、版本控制、监控等,全是实战干货,适合正在做 Agent 上线的团队参考。原文
02:51marktechpost@Asif Razzaq精选73°Sakana AI 推出 Sakana Fugu,一种编排模型,可将用户任务动态路由至可替换的前沿 LLM 池。其增强版 Fugu Ultra 在多个编码、推理和智能体基准测试中取得领先成绩。该模型通过选择最适合的模型来提升任务效率,无需用户手动切换。AI模型Sakana AISakana Fugu编排模型智能体推理模型1 个信源在谈推荐理由:Sakana AI 搞了个 Fugu 编排模型,能自动在多个前沿 LLM 之间切换最优选择,在编码和推理基准上表现很突出。原文
02:42Decoder@Matthias BastianGoogle DeepMind已将Interactions API设为Gemini模型和智能体的默认接口,取代了旧的generateContent API。新API采用简化schema和typed steps替代基于角色的结构。未来所有新的智能体功能将仅通过此API发布。AI产品Interactions APIGeminiGoogle DeepMind智能体推荐理由:Google DeepMind给Gemini换了新API,以后做智能体全靠它,老接口被取代了,开发者得抓紧学。原文
02:33Logan Kilpatrick@OfficialLoganK73°Google AI Studio 发布 Interactions API 正式版(GA),该新 API 旨在让用户在同一界面内编排不同模型和智能体,已成为 AI Studio 新的默认 API。Interactions API 为智能体(Agents)新阶段奠定基础,开发者可更高效地构建跨模型工作流。AI产品Google AI StudioInteractions APIMCP/工具智能体多模型协调推荐理由:Google AI Studio 正式上线了 Interactions API,能让你在一个界面里调度不同模型和智能体,做复杂工作流更方便了原文
02:09Philipp Schmid@_philschmid精选Google 推出 Interactions API,提供单一 API 接口调用 Gemini 模型和智能体。该 API 包含隔离的远程 Linux 沙箱环境,支持异步后台运行的 background=True 参数。已集成图像生成 Nano Banana、音乐生成 Lyria 3,并预告未来支持视频生成 Omni。同时具备多模态工具调用与组合能力,以及专用编码技能。开发者可通过该 API 构建人类与智能体交互的应用。AI产品Interactions APIGeminiGoogle智能体多模态推荐理由:Google 上线了 Interactions API,一个 API 就能调用 Gemini 模型和智能体,还有沙箱、图像音乐生成,异步运行很简单。原文
02:06Nous Research@NousResearchHermes Agent 现已集成 trycua,在 Windows 和 Linux 系统上支持计算机使用功能,此前该功能仅限 macOS。用户可以通过自然语言指令控制桌面操作。该更新由 NousResearch 发布,进一步扩大了代理的跨平台可用性。AI产品Hermes AgenttrycuaNousResearch跨平台智能体3 个信源在谈推荐理由:如果你用 Windows 或 Linux,现在也能用 Hermes Agent 控制电脑了,操作和 macOS 一样流畅。原文
02:05Nous Research@NousResearchNous Research 开发的智能体框架 Hermes Agent 在 GitHub 上获得 20 万颗星标。该项目基于开放权重模型构建可定制代理,支持多种工具调用和多步骤推理。里程碑反映出开发者社区对开源智能体框架的高度关注。AI产品Hermes AgentNous Research智能体GitHub开源项目推荐理由:看看 Nous Research 搞的 Hermes Agent,GitHub 上 20 万星了,开源智能体框架里很猛的。原文
02:04AWS Machine Learning Blog@Guy Bachar精选Ampersend 在 Amazon Bedrock AgentCore Payments 之上构建了一个按智能付费的路由层,让 AI 代理自动将任务路由到最有效的模型并按请求付费。该方案支持在预算内运行,并实现了双跳支付模式端到端工作。文章还提供了如何开始实施的具体步骤。技巧AmpersendAmazon BedrockAgentCore Payments智能体按需付费推荐理由:想给 AI 代理按请求计费?看 Ampersend 怎么用 Bedrock AgentCore 做自动路由,还能控预算。原文
00:55LangChain@LangChainAILangChain 举办的 Interrupt 智能体会议所有 session 录像已上线,可通过 interrupt.langchain.com/recordings 观看。会议涵盖多智能体协作、工具使用等主题,涉及 LangGraph、LangSmith 等平台。目前该推文有 752 次查看和 1 次转发。行业LangChainInterrupt智能体会议录像推荐理由:LangChain 把 Interrupt 大会所有录像都放出来了,想学智能体开发的同学直接去看吧。原文
00:50LangChain@LangChainAI精选LangChain指出,AI代理执行沙箱需满足两个关键要求:启动速度接近无服务器函数(避免代理等待2分钟VM启动),以及具备完整机器状态(支持安装依赖、编辑文件和断点续传)。代理本质上是会话中的工作进程,而非无状态请求处理器。技巧LangChain沙箱智能体无服务器函数推荐理由:LangChain讲清楚了代理沙箱的设计关键——既要快得像无服务器函数,又要能像全功能机器一样保存状态。做AI代理的人该看看。原文
00:24AI产品黄叔@PMbackttfuture推文作者使用成峰开发的Skill,结合Codex工具完成视频剪辑,整个流程只有最后在剪映中处理了约2分钟,其余全部由AI自动完成。作者认为这种丝滑体验标志着Agent剪辑时代的到来。该工作流展示了AI工具在视频创作中的实际应用,大幅减少人工操作。技巧Codex剪映成峰Skill视频生成智能体推荐理由:有人用成峰的Skill和Codex,剪视频全程只手动处理了2分钟,超丝滑,你也能试试。原文
23:55elvis@omarsar0精选该报告构建了五维分类法(对手方、载荷、交互状态、发现机制、模式灵活性),分析了九个活跃维护的开源智能体协议,包括MCP和A2A。报告发现每个智能体间协议都采用混合载荷与会话状态持久化组合,而去中心化发现机制仍属罕见。该研究映射了当前LLM agent通信层的标准化趋势,为选择通信层提供依据。论文地址:arxiv.org/abs/2606.19135。论文MCPA2A智能体多智能体系统开源模型推荐理由:如果你在选agent通信协议,这篇把MCP、A2A等9个协议的底层模式画清楚了,指出状态化会话是共识,去中心化发现还缺。原文
23:51Nathan Lambert: Interconnects@Nathan LambertGLM-5.2 是智谱AI推出的新模型,重点提升开放智能体场景下的表现。该模型在工具调用和多步推理任务上取得进展。GLM-5.2 在多项智能体相关基准上展现了更强的自主决策能力。AI模型GLM-5.2Zhipu AI智能体开放智能体1 个信源在谈推荐理由:GLM-5.2 把开放智能体的能力又推了一步,想看智能体怎么进化的可以瞄一眼。原文
21:53IT之家(博客/媒体)Anthropic工程负责人Fiona Fung指出,工程师越依赖Claude Code等AI智能体,彼此交流越少,长期可能感到孤独。团队通过组织编程午餐、黑客松和共同开发时段来创造面对面交流机会。调查显示,Claude Code已成为创业公司使用最多的AI编程工具,部分创始人优先用它处理复杂工程任务。Fung强调,即使使用方式不同,观察他人工作也能带来收获。行业Claude CodeAnthropic编程助手智能体行业动态10 个信源在谈推荐理由:Anthropic内部发现AI编程工具用多了反而让人更孤单,他们开始搞结对编程和黑客松,就是想让人少对着智能体、多跟真人交流。原文
20:36IT之家(博客/媒体)谷歌云与诺基亚于6月22日宣布扩展合作,将谷歌Gemini模型整合至诺基亚网络软件套件Nokia Assurance Center。双方基于Gemini开发了六个专项AI智能体,包括路由智能体、事件分类智能体、KPI选择器智能体、异常推理智能体、动作推理智能体和仪表板智能体。这些智能体帮助电信运营商降低运营成本、快速定位网络故障,并推动网络运维向全自动化演进。官方将于6月23日至25日在哥本哈根DTW Ignite大会现场演示上述智能体。AI产品谷歌云诺基亚Gemini智能体电信网络运维推荐理由:谷歌和诺基亚用Gemini做了六个电信运维智能体,能自动定位故障、推荐修复步骤,还支持自然语言生成仪表盘。运营商玩家可以看看怎么省钱提效。原文