IT之家(博客/媒体)精选53联发科在天玑开发者大会上发布天玑AI智能体化引擎2.0和开发套件3.0,并公布与OPPO、小米等厂商的合作成果。针对跨端智能体协同的痛点,联发科从IP设计、软件平台和生态层三个层面推进:统一NPU架构降低迁移成本,NeuroPilot平台实现一次开发多端部署,通过大模型和统一指令集打破生态壁垒。此外,联发科还讨论了AI定义汽车、内存涨价对端侧AI的影响,以及“龙虾”框架对芯片规划的启示。行业联发科智能体跨端协同天玑AI芯片推荐理由:联发科从芯片源头打通手机、汽车、眼镜等设备的智能体协同,做跨端AI应用的开发者可以直接参考其统一架构方案,避免重复适配。
arXiv cs.AI@Evan Rose, Tushin Mallick, Matthew D. Laws, Cristina Nita-Rotaru, Alina Oprea精选58论文提出APWA(Agent-Parallel Workload Architecture),一种分布式多智能体系统架构,旨在高效处理高度可并行化的智能体工作负载。APWA通过将工作流分解为无干扰的子问题,并利用独立资源并行处理,无需跨通信。该架构支持异构数据和多种并行模式,适用于广泛领域。实验表明,APWA能动态分解复杂查询为可并行工作流,并在先前系统完全失败的大规模任务上实现扩展。论文智能体分布式架构并行计算工作流分解APWA推荐理由:多智能体系统在复杂任务中常因推理和协调瓶颈而失效,APWA通过并行分解解决了这一痛点,做分布式AI系统或智能体编排的开发者值得关注其设计思路。
shao__meng@shao__meng精选73xAI 推出了 Grok Build CLI (beta),这是一个面向编码、应用构建和工作流自动化的 Agentic CLI 工具。目前仅向 SuperGrok Heavy 订阅用户开放,xAI 希望通过用户反馈迭代模型和产品。该工具具备快速终端渲染、计划视图、子智能体并行执行、技能装载、插件市场以及主动澄清等能力。底层模型为 grok-code-fast-1,在 SWE-Bench Verified 上达到 70.8%,上下文窗口为 256K。AI产品CLI工具智能体编码助手工作流自动化Grok推荐理由:Grok Build CLI 的 Plan 视图和子智能体并行能力解决了复杂任务的可视化与执行效率问题,做自动化工作流或编码的开发者可以直接体验,尤其适合需要多智能体协作的团队。
berryxia@berryxia精选72Prime Intellect 让 Claude Code(Opus 4.5)和 Codex(GPT 5.5)在 nanoGPT speedrun 的 optimizer track 上完全自主运行,使用闲置算力完成约 1 万次实验,消耗 1.4 万 H200 小时。Claude Code 将记录推进到 2930 steps,超越人类基准的 2990 steps,整个过程无人值守。实验在 optimizer 搜索、超参数扫描和方法 stacking 上高效,但在真正创新上遇到瓶颈。Prime Intellect 已开源所有 scratchpad、运行日志、配置和生成的 idea,将 AI 研究自动化从概念变为可复现的现实。AI产品AI研究自动化Claude CodeCodex开源/仓库智能体推荐理由:AI 研究自动化从概念走向可复现现实,做 AI 研究的团队可以直接参考这套开源实验记录,省下大量试错成本。
Andrej Karpathy@karpathy精选67Karpathy 在 Sequoia Ascent 2026 炉边谈话中分享了三个核心主题。首先,LLM 远不止是加速现有工作(如编程),他举了三个新例子:menugen 应用完全由 LLM 驱动无需传统代码、用 .md 技能替代 .sh 脚本安装软件、以及基于 LLM 的知识库处理非结构化数据。其次,他深入解释了 LLM 的“锯齿状能力”模式——为何同一个模型既能重构十万行代码,又会建议你去洗车——这源于领域可验证性和经济因素(收入/TAM 决定训练数据分布)。最后,他展望了智能体原生经济,包括产品服务分解为传感器、执行器和逻辑,以及如何让信息对 LLM 更可读,并暗示了全神经计算的未来。行业LLM智能体Karpathy智能体原生经济能力边界推荐理由:Karpathy 把 LLM 的“锯齿状能力”和智能体原生经济讲透了,做 AI 产品、搞智能体开发的团队看完会对能力边界和落地方向有全新认知,值得点开细品。
arXiv cs.LG@Jiayi Zhang, Yongfeng Gu, Jianhao Ruan, Maojia Song, Yiran Peng, Zhiguang Han, Jinyu Xiang, Zhitao Wang, Caiyin Yang, Yixi Ouyang, Bang Liu, Chenglin Wu, Yuyu Luo精选55论文提出AEvo,一种元编辑框架,将智能体演化视为交互环境,通过元代理观察累积的演化上下文(候选方案、反馈、轨迹、失败记录),并编辑控制未来演化的程序或代理上下文,而非直接生成下一个候选方案。该方法统一了基于程序和基于代理的演化方式,使累积证据在长周期搜索中可操作。在智能体和推理基准测试中,AEvo优于五种演化基线,相对最强基线提升26%。在三个开放式优化任务中,AEvo在相同迭代预算下达到最先进性能。论文智能体演化算法元编辑自动化优化论文推荐理由:AEvo解决了智能体演化中证据积累与机制修订脱节的问题,做自动化程序优化或长周期搜索的团队可以直接用这个框架提升效率。
Anthropic: Engineering(资讯)精选60Anthropic 发布了一篇关于 AI 智能体上下文工程的技术文章,详细介绍了如何通过精心设计系统提示、用户消息和工具定义来提升智能体的表现。文章提出了上下文工程的核心原则,包括明确角色、提供示例、分解任务、控制输出格式等。这些方法能显著减少智能体的幻觉和错误,提高任务完成率。对于正在构建或优化 AI 智能体的开发者来说,这是一份实用的操作手册。AI产品智能体上下文工程Anthropic提示词工程开发者指南推荐理由:做 AI 智能体的开发者终于有了系统性的上下文设计方法论——Anthropic 把工程经验总结成了可复用的原则,直接照着改 prompt 就能看到效果提升,建议点开收藏。
Anthropic: Engineering(资讯)精选50Anthropic 发布了一篇工程博客,详细介绍了如何利用 MCP(Model Context Protocol)实现代码执行,从而构建更高效的 AI 智能体。该方法允许模型在沙箱环境中安全地运行代码,并获取执行结果,显著提升了智能体在编程、数据分析等任务中的自主性和准确性。文章还讨论了 MCP 的设计原则、安全考量以及实际应用案例,为开发者提供了构建可靠代码执行智能体的实用指南。AI产品MCP/工具智能体代码执行Anthropic安全沙箱推荐理由:Anthropic 的这篇工程博客为构建能安全执行代码的智能体提供了权威参考,做 AI 智能体或编程助手的开发者可以直接借鉴其 MCP 实现方案。
Anthropic: Engineering(资讯)精选50Anthropic 发布 Agent Skills,一套用于增强 AI 智能体在真实环境中执行任务能力的工具集。Agent Skills 包含多个预构建模块,如文件操作、网络请求、数据解析等,让开发者无需从零编写复杂逻辑即可快速部署实用智能体。该项目旨在解决当前智能体在现实应用中缺乏可靠基础能力的问题,降低开发门槛并提升任务成功率。Anthropic 同时开源了相关代码,鼓励社区贡献更多技能模块。AI产品智能体AnthropicAgent Skills开源/仓库工具集推荐理由:做智能体应用的开发者不用再重复造轮子了——Agent Skills 直接提供了文件处理、网络请求等高频基础能力,拿来就能用,建议直接看源码。
IT之家(博客/媒体)精选75微软CEO纳德拉宣布,其AI安全系统MDASH在5月补丁星期二活动中协助发现Windows 11的16个CVE漏洞。MDASH采用超过100个专用智能体,通过对抗式流程降低误报,在私有驱动StorageDrive上实现21个植入漏洞全检出且误报为0。在CyberGym公共基准上,MDASH以88.45%的准确率领先第二名(83.1%)约5个百分点。该系统还回溯了clfs.sys和tcpip.sys的历史漏洞,召回率分别达96%和100%。AI产品AI安全智能体MCP/工具微软MDASH推荐理由:微软用100个AI智能体抓漏洞,准确率88.45%