精选 AI 资讯 · AI 热点

AITOP

正在升温更多 →

6月19日

18:41

Together AI@togethercompute

精选

推荐理由：GLM-5.2 支持百万级上下文，还能控制推理深度，搞智能体编程和复杂工具链的可以试试。Together AI 上直接用。

原文

18:37

Together AI@togethercompute

精选

Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。

AI模型 GLM 5.1 Together AI 推理优化内核重写

推荐理由：想知道Together AI怎么让GLM 5.1跑得更快？他们分享了三个工程优化点，对部署GLM 5.1有直接帮助。

原文

18:33

Together AI@togethercompute

精选

Kimi Moonshot 发布 Kimi-K2.7-Code，基于 Kimi K2.6 的专用编码智能体模型。该模型面向长周期软件工程工作流，支持工具调用和代理式推理。现已通过 Together AI 的推理栈提供，针对工具密集型编码代理场景优化。模型在多个编程基准上表现优于前代。

AI模型 Kimi-K2.7-Code 月之暗面智能体代码模型

推荐理由：月之暗面出了个专门写代码的智能体模型 K2.7-Code，在 Together AI 上就能跑，搞长期软件工程任务挺合适。

原文

17:12

宝玉@dotey

精选

宝玉更新了 baoyu-design skill，可在制作 PPT、动画视频或网站时调用 AI 生图技能配图。该 skill 基于声明式动画引擎，能导出 1080p 的 MP4 视频（使用 2 倍像素渲染后缩放）。它通过无头 Chromium 和 ffmpeg 逐帧截图生成视频，每 95 秒 30fps 动画需 2850 次截图。项目在 GitHub 开源（MIT 协议），已获 1.2K star。

技巧 baoyu-design AI生图 PPT生成动画视频开源项目

推荐理由：宝玉开源了 baoyu-design skill，能通过 AI 生图自动配 PPT 插图，还能导出 MP4 动画，效果比录屏好太多。

原文

16:29

berryxia@berryxia

精选

姚金刚老师用Codex在38小时内提交301个分支，将yao-meta-skill（创建其他skill的元框架）重构为2.0版本。Codex全程拆解任务、修复问题、迭代优化，并生成2.0与1.0的详细对比报告。升级版在结构、可靠性和可扩展性上有明显提升，所有文档和对比公开，可供他人参考如何用AI agent做复杂工程重构。整个过程展示了AI agent参与自身工具迭代的能力。

技巧 Codex yao-meta-skill GitHub 元Skill 智能体

推荐理由：姚老师用Codex搞了个大工程，38小时301个分支把自己造的元Skill升级到2.0，代码和对比报告都开源了，玩agent的可以抄作业。

原文

16:26

berryxia@berryxia

精选

Browser Use开源了一个浏览器agent模板B，基于Vercel的Eve构建。该模板让任何agent都能使用真实云端浏览器，并通过browser-harness实时查看操作过程。它支持初始化skills和MCPs，可直接从GitHub克隆使用。相比模拟环境或黑箱运行，模板B实现了每一步可视化、可调试，将browser automation推向更实用阶段。

AI产品 Browser Use 智能体浏览器自动化 MCP/工具开源项目

推荐理由：Browser Use直接开源了模板B，让你的Agent能连上真实云浏览器，还能实时看到它操作页面。调试方便多了，GitHub上就能clone。

原文

16:25

berryxia@berryxia

精选72°

OpenAI Codex推出Record & Replay功能，用户通过录制一次工作流（如报销流程）即可自动生成可检查、可编辑的skill。该功能将示范教学转化为可复用技能，目前仅支持macOS，欧洲国家暂不支持。录制由用户控制开始和结束，Codex将流程结构化为可迭代优化的技能，降低了Agent构建门槛。

AI产品 OpenAI Codex Record & Replay 工作流自动化技能录制

推荐理由：OpenAI Codex新功能让你录屏演示一遍就能自动生成可编辑的工作流技能，不用写Prompt，适合重复性任务自动化。

原文

16:24

berryxia@berryxia

精选

Matthew Berman 创建了 Loop Library，专门收集可直接复用的 agent 循环流程，涵盖从简单任务自动化到复杂多步工作流。该库与某个平台合作托管，用户可搜索现成模板或提交自己的流程。此前设计 agent 最耗时的退出、验证、失败处理等循环结构，现在能被社区公开验证的模板替代。这一做法将 agent 开发从每次重写循环推向模块化搭积木方向，为生态提供公共流程市场。

AI产品 Matthew Berman Loop Library agent loop 智能体工作流

推荐理由：Matthew Berman 建了个 Loop Library，把各种 agent 循环模板集中了，直接用现成的，不用自己从头设计流程。

原文

14:42

Simon Willison@simonw

精选

Jeremy Howard 称 GLM 5.2 是开放权重模型中的奇迹，性能至少与 Opus 4.8 和 GPT 5.5 持平。它速度快、成本低、输出简洁，且擅长长上下文处理。该模型由 Zai_org 发布，目前尚未在 Groq 或 Cerebras 等超快推理提供商上运行，但社区期待其部署。

AI模型 GLM-5.2 Zai_org 开放权重推理模型

推荐理由：GLM 5.2 开放权重、性能比肩闭源顶尖模型，还便宜又快，写代码或处理长文档会很顺手。

原文

14:00

小互@imxiaohu

精选73°

Codex推出Record & Replay功能，用户演示一次操作流程（如发YouTube视频：拉元数据、配缩略图、上传存为私密、核对），Codex即自动学习并生成可复用的Skill技能。下次遇到相同任务，Codex可独立完成全流程，无需用户干预。该功能还适用于贴发票、批量重命名文件、填写周报表、订票等重复性电脑操作。从每次写提示词到演示一次即够，大幅降低重复劳动成本。

AI产品 Codex Record & Replay 自动化工作流演示学习

推荐理由：Codex出了个新功能，你只要做一遍操作给它看，它就能学会并自动帮你干重复的电脑活，超级省时间。

原文

12:51

Cohere@cohere

精选

Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小，可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。

AI模型 Cohere 4-bit量化智能体编码模型开源模型

推荐理由：Cohere把自己最新的编程智能体模型压缩到4-bit，Mac上就能跑，本地开发效率直接拉满！

原文

11:46

arXiv cs.LG@Przemyslaw Musialski

精选

论文提出Lie-Algebra Attention，其中token被定义为矩阵李群G的元素gi，而非传统特征向量。注意力分数使用相对姿态的对数范数闭合形式sij = -‖log(gi^-1 gj)‖²/τ，无需学习核函数。该方法适用于非紧致非交换的仿射群Aff(2)，这是向量token方法无法达到的。在SE(2)、SO(3)和Aff(2)上的序列补全实验中，其参数比MLP核少50-80倍，且在SE(2)上性能更优，而向量token基线的不变性误差高达5-12个数量级。

论文 Lie-Algebra Attention 矩阵李群 SE(2)SO(3)群论注意力

推荐理由：这篇论文用群元素当token，不用那些复杂的学习核，参数还少50到80倍，做SE(2)、SO(3)和仿射群上的任务都更好，值得看看思路。

原文

11:16

pandaily@contact@pandaily.com (Pandaily)

精选76°

DeepSeek完成其首次外部融资轮，募资超过500亿元人民币。本轮融资采用无投票权结构，战略投资者包括腾讯、宁德时代和京东等。这是国内AI公司最大规模的单轮融资之一，将用于支持其大模型研发与基础设施扩展。

行业 DeepSeek Tencent CATL JD.com 融资

推荐理由：DeepSeek刚融了500多亿，腾讯、宁德时代这些大厂都跟投了，说明行业对它技术路线的认可。

原文

10:38

arXiv: DeepSeek@Arastoo Zibaeirad, Marco Vieira

精选

研究提出CWE-Trace框架，基于834个手动整理的Linux内核样本（覆盖74个CWE）评估LLM的漏洞检测能力。实验发现数据污染对性能无实质帮助：84%的污染样本不携带可用记忆信号。微调仅改变输出阈值（DFI范围-85.5至+94.8 pp），而不改变底层决策策略，模型在历史数据和截止后数据上表现一致。最佳检测准确率仅52.1%（高出随机2.1个百分点），CWE排名Top-1准确率低于1.3%，表明当前LLM缺乏可靠的安全推理能力。

论文 CWE-Trace Linux内核漏洞检测推理模型 Fine-tuning

推荐理由：这篇论文用800多个Linux内核漏洞样本做了严谨测试，发现LLM微调后只是改分数线，不是真懂安全。检测率刚过50%，别指望它们当安全审计员。

原文

09:50

arXiv cs.LG@María Gragera Garcés, Lirandë Pira

精选

该论文提出量子环全归约（quantum ring all-reduce），利用预共享纠缠和超密编码，将逐链路在线通信量降低至最优因子2倍。协议通过验证纠缠实现可组合的ε安全聚合，仅需2倍GHZ副本开销，提供经典协议无法实现的信息论隐私。在梯度冲突检测中，对于GapIP_τ问题，量子优势在边际参数上呈二次方改进：需Õ(τ⁻¹ log P)量子比特 vs Õ(min(τ⁻², P))经典比特。对于TieAudit_ε问题，量子优势呈指数级分离：仅需O(ε⁻² log P)量子比特，而经典需Ω(√P)比特。

论文 ring all-reduce 量子通信分布式训练隐私聚合梯度冲突检测

推荐理由：这篇论文讲怎么用量子通信让分布式训练既省带宽又有信息论隐私保护，比经典协议通信量减半，梯度检测上还有指数级优势。

原文

09:48

arXiv cs.LG@Xiang Rao, Yuxuan Shen

精选

研究者提出QCPIKAN，这是首个量子-经典物理信息Kolmogorov-Arnold网络，采用Chebyshev多项式KAN层和参数化量子电路。理论证明该设计能使高频误差以指数率收敛，并有效抑制数值色散。在三种典型渗流场景（单相流、组分输送、两相流）中验证。相比现有量子-经典物理信息神经网络，QCPIKAN在全局预测精度、局部误差控制、动态演化跟踪和位移前沿定位上表现更优。

AI模型 QCPIKAN KAN 量子经典混合物理驱动网络 PDE求解

推荐理由：这篇论文发布了QCPIKAN，首个混合量子经典PDE求解器，用Chebyshev KAN层加速收敛，渗流模拟精度远超市面同类。

原文

09:34

arXiv: DeepSeek@Ruiyang Ma, Teng Ma, Junru Li, Hantian Zha, Xuchun Shang, Qingda Hu, Zheng Liu, Xinjun Yang, Tao Ma, Guojie Luo

精选71°

长上下文LLM推理的内存瓶颈日益突出。传统RDMA解耦内存池对于稀疏注意力模型效率低下，仍需完整获取KV缓存。SAC系统利用CXL的低延迟、缓存行粒度加载/存储语义，仅在推理时按需获取所需的top-k KV条目。在DeepSeek-V3.2上使用SGLang的评估显示，相比RDMA基线，SAC实现了2.1倍吞吐量提升、9.7倍TTFT降低和1.8倍TBT降低。

论文 SAC CXL KV缓存稀疏注意力 DeepSeek-V3.2

推荐理由：长上下文推理，内存传输是瓶颈。新方案SAC用CXL按需取KV缓存，比RDMA吞吐量翻倍、延迟降到十分之一，做稀疏推理的值得一看。

原文

09:26

Yangyi@Yangyixxxx

精选

OpenAI Codex 桌面端推出 Record & Replay 功能，用户可在 macOS 上演示重复性操作，Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式，支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数，Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS，欧盟暂不可用，使用前需开启 Computer Use。

AI产品 OpenAI Codex macOS Computer Use 自动化

推荐理由：OpenAI Codex 新功能让你在 Mac 上演示一遍操作，它就能自动记录并重复执行，以后填单、发视频这类固定流程再不用手写了。

原文

09:07

Aravind Srinivas@AravSrinivas

精选73°

Perplexity发布了Brain，一个持续学习的记忆系统，能构建包含所有会话、连接器和文件的上下文图。Brain会在夜间主动更新最新上下文，并自动接入Computer上的每个任务，使Computer具备状态化和自我改进能力。该功能以研究预览形式向所有Perplexity Max订阅者开放。

AI产品 Perplexity Brain Computer 上下文图记忆系统

推荐理由：Perplexity搞了个Brain，能给Computer自动建上下文图，让它记住之前的事，越用越聪明，Max用户快去试试。

原文

07:41

AWS Machine Learning Blog@Apoorva Chandra

精选

Amazon SageMaker AI 提供全托管实时推理，支持单模型端点（SME）和推理组件（IC）两种架构。通过 CloudWatch 详细指标和 Insights 仪表盘，用户可监控生成式 AI 推理的延迟、吞吐量等关键指标。该仪表盘支持自定义视图和异常检测，帮助快速定位性能瓶颈。SME 和 IC 端点均能集成此观测能力，适用于生产环境的调试与优化。

技巧 SageMaker CloudWatch 生成式 AI 推理监控与调试

推荐理由：AWS 教你用 CloudWatch 盯着 SageMaker 上的生成式 AI 推理，有详细指标和仪表盘，调性能抓问题都好使。

原文

06:40

Stanford AI Lab@StanfordAILab

精选

斯坦福AI实验室发布M*运行时，用于统一服务多模态模型。相比专业系统，M*在omni TTS任务上提速2.7倍，在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。

AI产品 M*斯坦福多模态运行时

推荐理由：斯坦福新发的M*运行时，一个系统就能搞定各种多模态模型，速度比专业方案快2到12倍，值得做部署的看看。

原文

06:39

OpenAI@OpenAI

精选

OpenAI发布测试结果，评估模型对齐在压力下的表现。在对抗性提示下，模型更难被引导至有害行为，同时依然能响应有益指令。初步证据表明，模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性，未提及具体模型版本或基准分数。

AI模型 OpenAI 对齐对抗性提示有害微调鲁棒性

推荐理由：OpenAI发现他们的模型在对抗压力下挺得住，不容易被带坏，安全对齐效果不错。

原文

06:38

Greg Brockman@gdb

精选72°

OpenAI 与波士顿儿童医院及哈佛大学合作，在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例，她从 9 岁起持续肌肉无力，在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。

AI模型 OpenAI o3 Deep Research 罕见病推理模型医疗AI

推荐理由：OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例，找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁，终于有了答案。这 AI 真的能救命。

原文

05:34

宝玉@dotey

精选76°

Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能，可将终端会话内容（如 PR 走查、调试时间线、发布清单）生成实时更新的私有网页，团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文（包括代码库、外部工具和对话内容）自动更新，历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放，个人用户暂时无法使用。

AI产品 Claude Code Artifact Anthropic 团队协作编程助手

推荐理由：Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友，不用再口述解释 agent 做了什么，适合团队协作。

原文

05:07

GitHub@github

精选

MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优，在其尺寸下提供最佳质量。早期测试中，它超越其他小模型。

AI模型 MAI-Code-1-Flash Microsoft GitHub Copilot 编程助手

推荐理由：微软把专为 Copilot 调的小模型放到命令行了，代码质量比别的小模型好，试试吧。

原文

04:40

Greg Brockman@gdb

精选

OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流（如填写费用报告或提交休假申请），系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。

AI产品 Codex OpenAI Record & Replay 工作流自动化 AI编程助手

推荐理由：OpenAI 给 Codex 加了个新玩法：你演示一次操作，它就能学会并复用，比如填报销单。还能编辑保存的技能，挺实用。

原文

04:32

宝玉@dotey

精选73°

OpenAI Codex 桌面端新增 Record & Replay 功能，允许用户在 Mac 上录制一系列操作，Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS，欧盟地区不可用，使用前需开启 Computer Use。该功能旨在简化日常重复性任务，如报销填单、发布视频、创建 issue 等。录制完成后，用户可在新对话中调用 Skill 并传入不同参数，由 Codex 结合 Computer Use、浏览器和插件自动执行。

AI产品 OpenAI Codex Record & Replay Computer Use 自动化智能体

推荐理由：OpenAI Codex 这次不用你写指令了，Mac 上演示一遍操作就能生成可复用的 Skill，下次改改参数自动跑，报销填单之类的好用了。

原文

04:25

Clement Delangue@ClementDelangue

精选

AI模型 Poolside Laguna M.1 Hugging Face 开源模型长上下文

推荐理由：Poolside 把最强的 Laguna M.1 模型完全开放了，256K 上下文，Apache 2.0 许可，直接去 Hugging Face 下载权重用。

原文

04:21

Cursor@cursor_ai

精选

/automate 是 Cursor 新推出的智能体技能，用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具，无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。

AI产品 Cursor /automate 智能体自动化自然语言

推荐理由：Cursor 新技能，说句话就能让智能体帮你配自动化流程，省掉写代码的麻烦。

原文

04:20

Cursor@cursor_ai

精选

Cursor 发布了新更新，新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用（computer use）能力，可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。

AI产品 Cursor GitHub Cloud Agents 编程助手自动化

推荐理由：Cursor 给云端智能体加了电脑操控能力，还能用 GitHub 事件自动触发，做自动化工作流很方便。

原文

6月11日