18:41Together AI@togethercompute精选Zai_org 推出其最新旗舰开源模型 GLM-5.2,支持 1M token 长上下文,可灵活调整推理思考力度。该模型在智能体编程任务上表现更强,现已通过 Together AI 提供推理服务,专为长上下文和工具密集型智能体工作负载优化。AI模型GLM-5.2Zai_orgTogether AI智能体长上下文推荐理由:GLM-5.2 支持百万级上下文,还能控制推理深度,搞智能体编程和复杂工具链的可以试试。Together AI 上直接用。原文
18:37Together AI@togethercompute精选Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。AI模型GLM 5.1Together AI推理优化内核重写推荐理由:想知道Together AI怎么让GLM 5.1跑得更快?他们分享了三个工程优化点,对部署GLM 5.1有直接帮助。原文
18:33Together AI@togethercompute精选Kimi Moonshot 发布 Kimi-K2.7-Code,基于 Kimi K2.6 的专用编码智能体模型。该模型面向长周期软件工程工作流,支持工具调用和代理式推理。现已通过 Together AI 的推理栈提供,针对工具密集型编码代理场景优化。模型在多个编程基准上表现优于前代。AI模型Kimi-K2.7-Code月之暗面智能体代码模型5 个信源在谈推荐理由:月之暗面出了个专门写代码的智能体模型 K2.7-Code,在 Together AI 上就能跑,搞长期软件工程任务挺合适。原文
17:12宝玉@dotey精选宝玉更新了 baoyu-design skill,可在制作 PPT、动画视频或网站时调用 AI 生图技能配图。该 skill 基于声明式动画引擎,能导出 1080p 的 MP4 视频(使用 2 倍像素渲染后缩放)。它通过无头 Chromium 和 ffmpeg 逐帧截图生成视频,每 95 秒 30fps 动画需 2850 次截图。项目在 GitHub 开源(MIT 协议),已获 1.2K star。技巧baoyu-designAI生图PPT生成动画视频开源项目推荐理由:宝玉开源了 baoyu-design skill,能通过 AI 生图自动配 PPT 插图,还能导出 MP4 动画,效果比录屏好太多。原文
16:29berryxia@berryxia精选姚金刚老师用Codex在38小时内提交301个分支,将yao-meta-skill(创建其他skill的元框架)重构为2.0版本。Codex全程拆解任务、修复问题、迭代优化,并生成2.0与1.0的详细对比报告。升级版在结构、可靠性和可扩展性上有明显提升,所有文档和对比公开,可供他人参考如何用AI agent做复杂工程重构。整个过程展示了AI agent参与自身工具迭代的能力。技巧Codexyao-meta-skillGitHub元Skill智能体推荐理由:姚老师用Codex搞了个大工程,38小时301个分支把自己造的元Skill升级到2.0,代码和对比报告都开源了,玩agent的可以抄作业。原文
16:26berryxia@berryxia精选Browser Use开源了一个浏览器agent模板B,基于Vercel的Eve构建。该模板让任何agent都能使用真实云端浏览器,并通过browser-harness实时查看操作过程。它支持初始化skills和MCPs,可直接从GitHub克隆使用。相比模拟环境或黑箱运行,模板B实现了每一步可视化、可调试,将browser automation推向更实用阶段。AI产品Browser Use智能体浏览器自动化MCP/工具开源项目推荐理由:Browser Use直接开源了模板B,让你的Agent能连上真实云浏览器,还能实时看到它操作页面。调试方便多了,GitHub上就能clone。原文
16:25berryxia@berryxia精选72°OpenAI Codex推出Record & Replay功能,用户通过录制一次工作流(如报销流程)即可自动生成可检查、可编辑的skill。该功能将示范教学转化为可复用技能,目前仅支持macOS,欧洲国家暂不支持。录制由用户控制开始和结束,Codex将流程结构化为可迭代优化的技能,降低了Agent构建门槛。AI产品OpenAI CodexRecord & Replay工作流自动化技能录制10 个信源在谈推荐理由:OpenAI Codex新功能让你录屏演示一遍就能自动生成可编辑的工作流技能,不用写Prompt,适合重复性任务自动化。原文
16:24berryxia@berryxia精选Matthew Berman 创建了 Loop Library,专门收集可直接复用的 agent 循环流程,涵盖从简单任务自动化到复杂多步工作流。该库与某个平台合作托管,用户可搜索现成模板或提交自己的流程。此前设计 agent 最耗时的退出、验证、失败处理等循环结构,现在能被社区公开验证的模板替代。这一做法将 agent 开发从每次重写循环推向模块化搭积木方向,为生态提供公共流程市场。AI产品Matthew BermanLoop Libraryagent loop智能体工作流推荐理由:Matthew Berman 建了个 Loop Library,把各种 agent 循环模板集中了,直接用现成的,不用自己从头设计流程。原文
14:42Simon Willison@simonw精选Jeremy Howard 称 GLM 5.2 是开放权重模型中的奇迹,性能至少与 Opus 4.8 和 GPT 5.5 持平。它速度快、成本低、输出简洁,且擅长长上下文处理。该模型由 Zai_org 发布,目前尚未在 Groq 或 Cerebras 等超快推理提供商上运行,但社区期待其部署。AI模型GLM-5.2Zai_org开放权重推理模型推荐理由:GLM 5.2 开放权重、性能比肩闭源顶尖模型,还便宜又快,写代码或处理长文档会很顺手。原文
14:00小互@imxiaohu精选73°Codex推出Record & Replay功能,用户演示一次操作流程(如发YouTube视频:拉元数据、配缩略图、上传存为私密、核对),Codex即自动学习并生成可复用的Skill技能。下次遇到相同任务,Codex可独立完成全流程,无需用户干预。该功能还适用于贴发票、批量重命名文件、填写周报表、订票等重复性电脑操作。从每次写提示词到演示一次即够,大幅降低重复劳动成本。AI产品CodexRecord & Replay自动化工作流演示学习推荐理由:Codex出了个新功能,你只要做一遍操作给它看,它就能学会并自动帮你干重复的电脑活,超级省时间。原文
12:51Cohere@cohere精选Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小,可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。AI模型Cohere4-bit量化智能体编码模型开源模型推荐理由:Cohere把自己最新的编程智能体模型压缩到4-bit,Mac上就能跑,本地开发效率直接拉满!原文
11:46arXiv cs.LG@Przemyslaw Musialski精选论文提出Lie-Algebra Attention,其中token被定义为矩阵李群G的元素gi,而非传统特征向量。注意力分数使用相对姿态的对数范数闭合形式sij = -‖log(gi^-1 gj)‖²/τ,无需学习核函数。该方法适用于非紧致非交换的仿射群Aff(2),这是向量token方法无法达到的。在SE(2)、SO(3)和Aff(2)上的序列补全实验中,其参数比MLP核少50-80倍,且在SE(2)上性能更优,而向量token基线的不变性误差高达5-12个数量级。论文Lie-Algebra Attention矩阵李群SE(2)SO(3)群论注意力推荐理由:这篇论文用群元素当token,不用那些复杂的学习核,参数还少50到80倍,做SE(2)、SO(3)和仿射群上的任务都更好,值得看看思路。原文
11:16pandaily@contact@pandaily.com (Pandaily)精选76°DeepSeek完成其首次外部融资轮,募资超过500亿元人民币。本轮融资采用无投票权结构,战略投资者包括腾讯、宁德时代和京东等。这是国内AI公司最大规模的单轮融资之一,将用于支持其大模型研发与基础设施扩展。行业DeepSeekTencentCATLJD.com融资推荐理由:DeepSeek刚融了500多亿,腾讯、宁德时代这些大厂都跟投了,说明行业对它技术路线的认可。原文
10:38arXiv: DeepSeek@Arastoo Zibaeirad, Marco Vieira精选研究提出CWE-Trace框架,基于834个手动整理的Linux内核样本(覆盖74个CWE)评估LLM的漏洞检测能力。实验发现数据污染对性能无实质帮助:84%的污染样本不携带可用记忆信号。微调仅改变输出阈值(DFI范围-85.5至+94.8 pp),而不改变底层决策策略,模型在历史数据和截止后数据上表现一致。最佳检测准确率仅52.1%(高出随机2.1个百分点),CWE排名Top-1准确率低于1.3%,表明当前LLM缺乏可靠的安全推理能力。论文CWE-TraceLinux内核漏洞检测推理模型Fine-tuning推荐理由:这篇论文用800多个Linux内核漏洞样本做了严谨测试,发现LLM微调后只是改分数线,不是真懂安全。检测率刚过50%,别指望它们当安全审计员。原文
09:50arXiv cs.LG@María Gragera Garcés, Lirandë Pira精选该论文提出量子环全归约(quantum ring all-reduce),利用预共享纠缠和超密编码,将逐链路在线通信量降低至最优因子2倍。协议通过验证纠缠实现可组合的ε安全聚合,仅需2倍GHZ副本开销,提供经典协议无法实现的信息论隐私。在梯度冲突检测中,对于GapIP_τ问题,量子优势在边际参数上呈二次方改进:需Õ(τ⁻¹ log P)量子比特 vs Õ(min(τ⁻², P))经典比特。对于TieAudit_ε问题,量子优势呈指数级分离:仅需O(ε⁻² log P)量子比特,而经典需Ω(√P)比特。论文ring all-reduce量子通信分布式训练隐私聚合梯度冲突检测推荐理由:这篇论文讲怎么用量子通信让分布式训练既省带宽又有信息论隐私保护,比经典协议通信量减半,梯度检测上还有指数级优势。原文
09:48arXiv cs.LG@Xiang Rao, Yuxuan Shen精选研究者提出QCPIKAN,这是首个量子-经典物理信息Kolmogorov-Arnold网络,采用Chebyshev多项式KAN层和参数化量子电路。理论证明该设计能使高频误差以指数率收敛,并有效抑制数值色散。在三种典型渗流场景(单相流、组分输送、两相流)中验证。相比现有量子-经典物理信息神经网络,QCPIKAN在全局预测精度、局部误差控制、动态演化跟踪和位移前沿定位上表现更优。AI模型QCPIKANKAN量子经典混合物理驱动网络PDE求解推荐理由:这篇论文发布了QCPIKAN,首个混合量子经典PDE求解器,用Chebyshev KAN层加速收敛,渗流模拟精度远超市面同类。原文
09:34arXiv: DeepSeek@Ruiyang Ma, Teng Ma, Junru Li, Hantian Zha, Xuchun Shang, Qingda Hu, Zheng Liu, Xinjun Yang, Tao Ma, Guojie Luo精选71°长上下文LLM推理的内存瓶颈日益突出。传统RDMA解耦内存池对于稀疏注意力模型效率低下,仍需完整获取KV缓存。SAC系统利用CXL的低延迟、缓存行粒度加载/存储语义,仅在推理时按需获取所需的top-k KV条目。在DeepSeek-V3.2上使用SGLang的评估显示,相比RDMA基线,SAC实现了2.1倍吞吐量提升、9.7倍TTFT降低和1.8倍TBT降低。论文SACCXLKV缓存稀疏注意力DeepSeek-V3.22 个信源在谈推荐理由:长上下文推理,内存传输是瓶颈。新方案SAC用CXL按需取KV缓存,比RDMA吞吐量翻倍、延迟降到十分之一,做稀疏推理的值得一看。原文
09:26Yangyi@Yangyixxxx精选OpenAI Codex 桌面端推出 Record & Replay 功能,用户可在 macOS 上演示重复性操作,Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式,支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数,Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS,欧盟暂不可用,使用前需开启 Computer Use。AI产品OpenAICodexmacOSComputer Use自动化10 个信源在谈推荐理由:OpenAI Codex 新功能让你在 Mac 上演示一遍操作,它就能自动记录并重复执行,以后填单、发视频这类固定流程再不用手写了。原文
09:07Aravind Srinivas@AravSrinivas精选73°Perplexity发布了Brain,一个持续学习的记忆系统,能构建包含所有会话、连接器和文件的上下文图。Brain会在夜间主动更新最新上下文,并自动接入Computer上的每个任务,使Computer具备状态化和自我改进能力。该功能以研究预览形式向所有Perplexity Max订阅者开放。AI产品PerplexityBrainComputer上下文图记忆系统推荐理由:Perplexity搞了个Brain,能给Computer自动建上下文图,让它记住之前的事,越用越聪明,Max用户快去试试。原文
07:41AWS Machine Learning Blog@Apoorva Chandra精选Amazon SageMaker AI 提供全托管实时推理,支持单模型端点(SME)和推理组件(IC)两种架构。通过 CloudWatch 详细指标和 Insights 仪表盘,用户可监控生成式 AI 推理的延迟、吞吐量等关键指标。该仪表盘支持自定义视图和异常检测,帮助快速定位性能瓶颈。SME 和 IC 端点均能集成此观测能力,适用于生产环境的调试与优化。技巧SageMakerCloudWatch生成式 AI推理监控与调试推荐理由:AWS 教你用 CloudWatch 盯着 SageMaker 上的生成式 AI 推理,有详细指标和仪表盘,调性能抓问题都好使。原文
06:40Stanford AI Lab@StanfordAILab精选斯坦福AI实验室发布M*运行时,用于统一服务多模态模型。相比专业系统,M*在omni TTS任务上提速2.7倍,在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。AI产品M*斯坦福多模态运行时推荐理由:斯坦福新发的M*运行时,一个系统就能搞定各种多模态模型,速度比专业方案快2到12倍,值得做部署的看看。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
05:34宝玉@dotey精选76°Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能,可将终端会话内容(如 PR 走查、调试时间线、发布清单)生成实时更新的私有网页,团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文(包括代码库、外部工具和对话内容)自动更新,历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放,个人用户暂时无法使用。AI产品Claude CodeArtifactAnthropic团队协作编程助手10 个信源在谈推荐理由:Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友,不用再口述解释 agent 做了什么,适合团队协作。原文
05:07GitHub@github精选MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优,在其尺寸下提供最佳质量。早期测试中,它超越其他小模型。AI模型MAI-Code-1-FlashMicrosoftGitHub Copilot编程助手推荐理由:微软把专为 Copilot 调的小模型放到命令行了,代码质量比别的小模型好,试试吧。原文
04:40Greg Brockman@gdb精选OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流(如填写费用报告或提交休假申请),系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。AI产品CodexOpenAIRecord & Replay工作流自动化AI编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了个新玩法:你演示一次操作,它就能学会并复用,比如填报销单。还能编辑保存的技能,挺实用。原文
04:32宝玉@dotey精选73°OpenAI Codex 桌面端新增 Record & Replay 功能,允许用户在 Mac 上录制一系列操作,Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS,欧盟地区不可用,使用前需开启 Computer Use。该功能旨在简化日常重复性任务,如报销填单、发布视频、创建 issue 等。录制完成后,用户可在新对话中调用 Skill 并传入不同参数,由 Codex 结合 Computer Use、浏览器和插件自动执行。AI产品OpenAI CodexRecord & ReplayComputer Use自动化智能体10 个信源在谈推荐理由:OpenAI Codex 这次不用你写指令了,Mac 上演示一遍操作就能生成可复用的 Skill,下次改改参数自动跑,报销填单之类的好用了。原文
04:25Clement Delangue@ClementDelangue精选Poolside 发布了其最新模型 Laguna M.1,拥有 256K 上下文长度。该模型采用 Apache 2.0 许可,权重已开放至 Hugging Face。包括基础版和微调版检查点可供下载。AI模型PoolsideLaguna M.1Hugging Face开源模型长上下文2 个信源在谈推荐理由:Poolside 把最强的 Laguna M.1 模型完全开放了,256K 上下文,Apache 2.0 许可,直接去 Hugging Face 下载权重用。原文
04:21Cursor@cursor_ai精选/automate 是 Cursor 新推出的智能体技能,用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具,无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。AI产品Cursor/automate智能体自动化自然语言5 个信源在谈推荐理由:Cursor 新技能,说句话就能让智能体帮你配自动化流程,省掉写代码的麻烦。原文
04:20Cursor@cursor_ai精选Cursor 发布了新更新,新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用(computer use)能力,可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。AI产品CursorGitHubCloud Agents编程助手自动化6 个信源在谈推荐理由:Cursor 给云端智能体加了电脑操控能力,还能用 GitHub 事件自动触发,做自动化工作流很方便。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……